Análise forense de imagens digitais

(1)

Universidade de Aveiro Departamento deElectrónica, Telecomunica¸cões e Informática, 2011

F´

abio

Emanuel Batista

Marques

(2)

(3)

Universidade de Aveiro Departamento deElectrónica, Telecomunica¸cões e Informática, 2011

F´

abio

Emanuel Batista

Marques

An´

alise Forense de Imagens Digitais

Disserta¸cão apresentada à Universidade de Aveiro para cumprimento dos requis´ıtos necessários à obten¸cão do grau de Mestre em Engenharia de Computadores e Telemática, realizada sob a orienta¸cão cient´ıfica de António Neves e Armando Pinho, Professores do Departamento de Electrónica, Tele-comunica¸cões e Informática da Universidade de Aveiro

(4)

(5)

Armando Jos´e formoso de Pinho

Profª. Doutora

Prof. Doutor

Ant´onio Jos´e Ribeiro Neves

Prof. Doutor

Ana Maria Perfeito Tom´e

Vitor Manuel Ferreira dos Santos o j´uri / the jury

presidente / president

Professora Associada da Universidade de Aveiro (por delega¸c˜ao do Reitor da Uni-versidade de Aveiro)

vogais / examiners committee

Professor auxiliar convidado da Universidade de Aveiro (orientador)

Professor Associado com Agrega¸c˜ao da Universidade de Aveiro (co-orientador)

Professor Associado da Universidade de Aveiro

(6)

(7)

agradecimentos / acknowledgements

Um especial agradecimento ao Doutor Ant´onio Neves e ao Doutor Armando Pinho, meus orientadores, que muito me ensinaram e aconselharam, toda a paciˆencia que tiveram comigo.

Aos meus pais que tudo fizeram para eu aqui puder chegar, mesmo que, em alguns momentos n˜ao lhes tenha sido f´acil.

Ao meu irmão que também muito me ajudou em todos os momentos. A todos os amigos que estiveram presentes ao longo da minha vida académica.

(8)

(9)

Resumo Nos últimos anos, temos vindo a observar uma grande evolu¸cão no hardware de capta¸cão e software de edi¸cão de imagem digital. Ao mesmo tempo, o custo do equipamento tem também decrescido, principalmente ao n´ıvel do software _{de edi¸cão, onde existem vários programas freeware, por exemplo o} GIMP [1], que foi utilizado para trabalhar as imagens nesta disserta¸cão. A evolu¸cão observada tem aumentado a preocupa¸cão em rela¸cão à veraci-dade das imagens que todos os dias aparecem nos meios de comunica¸cão. Com isto, o ditado ”uma imagem vale mais que mil palavras”come¸ca a perder o seu significado.

Para combater esta preocupa¸cão e aumentar a confian¸ca das pessoas nas imagens digitais, ao longo dos últimos anos têm sido desenvolvidos algorit-mos que permitem a deteçcão de altera¸cões em imagens.

Nesta disserta¸cão, apresentamos um estudo das técnicas apresentadas ao longo do tempo para deteçcão de altera¸cões em imagens digitais e apresen-tamos também um estudo mais aprofundado de duas dessas técnicas. O primeiro algoritmo apresentado está baseado na correla¸cão entre p´ıxeis e detecta se existe a cópia de uma parte da imagem para outro lado na mesma imagem, de forma a ocultar uma pessoa ou objecto. O segundo algoritmo, baseia-se no estudo da correla¸cão entre os planos binários da imagem, para detectar se existiu algum tipo de altera¸cões na imagem, como por exemplo aumento do brilho ou mesmo a rota¸cão da imagem.

(10)

(11)

Abstract Over the last years we have observed a significant evolution in the capture hardware and editing software for digital imaging. At the same time, the cost of the equipment has also decreased, especially at the level of editing software, where there are several freeware programs, for example GIMP [1], which was used in this thesis. The observed evolution has increased the concern about the veracity of the images, which appear every day in the media. With this, the saying ”a picture is worth a thousand words”begins to lose the meaning.

In order to combat this concern and increase public confidence in the digital images, over the last few years algorithms have been developed for detecting manipulations in images.

In this thesis, we present a study of the techniques presented over time for digital image manipulation and also present a further study of two of these techniques.

The first algorithm presented is based on the correlation between pixels and detects if there is a copy of a portion of the image to other location in the same image in order to hide a person or object. The second algorithm, based on the correlation between the binary planes of the image, detects if there was some kind of manipulation in the image, such as increased brightness or image rotation.

(12)

(13)

Conte´

udo

Conte´udo i

Lista de Figuras iii

Lista de Tabelas v

1 Introdu¸c˜ao 1

1.1 Contribui¸c˜oes desta tese . . . 3

1.2 Estrutura da tese . . . 3

2 Estado da arte 5 2.1 Informa¸c˜ao retirada dos p´ıxeis da imagem . . . 5

2.1.1 Clonagem . . . 5

2.1.2 Reamostragem . . . 6

2.1.3 Jun¸c˜ao . . . 7

2.1.4 Estat´ısticas . . . 7

2.2 Informa¸c˜ao sobre o formato da imagem . . . 8

2.2.1 Quantiza¸c˜ao JPEG . . . 8

2.2.2 Duplo JPEG . . . 8

2.2.3 Artefactos de bloco no JPEG . . . 9

2.3 Informa¸c˜ao relativa `a captura da imagem . . . 10

2.3.1 Desvio crom´atico . . . 10

2.3.2 Arrays de filtros de cor . . . 12

2.3.3 Resposta da cˆamara . . . 13

2.3.4 Sensor de ru´ıdo . . . 14

2.4 Informa¸c˜ao baseada no ambiente f´ısico . . . 15

2.4.1 Direc¸c˜ao da luz 2-D . . . 15

2.4.2 Direc¸c˜ao da luz 3-D . . . 16

2.4.3 Luz ambiente . . . 18

2.5 Informa¸c˜ao baseada na geometria . . . 19

3 Algoritmo baseado na correla¸c˜ao entre p´ıxeis 21 3.1 Conceitos b´asicos . . . 22

3.2 Algoritmo . . . 22

3.3 Resultados experimentais . . . 25

(14)

4 Algoritmo baseado na correla¸cão entre planos binários 33 4.1 Conceitos básicos . . . 34 4.2 Algoritmo . . . 35 4.3 Resultados experimentais . . . 38 4.4 Discussão . . . 38 5 Conclusões 41 Bibliografia 43

(15)

Lista de Figuras

1.1 Exemplo de uma imagem de um soldado britˆanico . . . 1

1.2 Processo de capta¸c˜ao de uma imagem[2]. . . 2

1.3 Exemplo de altera¸c˜ao clonagem . . . 3

2.1 Exemplo de altera¸c˜ao clonagem . . . 6

2.2 Exemplo de altera¸c˜ao reamostragem . . . 7

2.3 Exemplo JPEG blocking . . . 10

2.4 Exemplo desvio crom´atico . . . 11

2.5 Exemplo refrac¸c˜ao da luz 1-D . . . 11

2.6 Exemplo refrac¸c˜ao da luz 2-D . . . 12

2.7 Resposta da câmara (CRF) . . . 14 2.8 Estimar ru´ıdo . . . 15 2.9 Direçcão da luz 2-D . . . 17 2.10 Direçcão da luz 3-D . . . 17 2.11 Direçcão da luz 3-D . . . 18 3.1 Vizinhan¸ca de p´ıxeis . . . 21 3.2 Aplicar DCT . . . 22

3.3 Parte de uma imagem copiada de um lado para o outro [3]. . . 23

3.4 Diagrama de blocos do algoritmo 1. . . 23

3.5 Percorrer bloco . . . 24

3.6 Mesmo vector deslocamento [3]. . . 25

3.7 Imagem com uma altera¸c˜ao. . . 28

3.14 Imagem com duas altera¸c˜oes. . . 29

3.17 Imagem com duas altera¸c˜ao. . . 30

3.18 Imagem com trˆes altera¸c˜oes. . . 30

(16)

3.21 Imagem com trˆes altera¸c˜ao. . . 30

3.23 Imagem com quatro altera¸c˜oes. . . 31

3.24 Imagem com seis altera¸c˜oes. . . 31

4.1 Planos Bin´arios . . . 33

4.2 Plano Bin´ario . . . 34

4.3 Exemplo de altera¸c˜ao . . . 35

4.4 P´ıxeis vizinhos . . . 36

(17)

Lista de Tabelas

3.1 Q: tabela de quantiza¸c˜ao JPEG. . . 25

3.2 Tabela de resultados obtidos com o algoritmo baseado na DCT. . . 26

3.3 Tabela de resultados obtidos com o algoritmo baseado nos blocos originais. . 27

4.1 Peso dos vizinhos . . . 37

4.2 Resultados do algoritmo 2 . . . 38

4.3 Resultados do algoritmo 2 . . . 39

(18)

(19)

Cap´ıtulo 1

Introdu¸

c˜

ao

Vivemos numa era em que a utiliza¸cão de imagens digitais atingiu propor¸cões outrora impensáveis. Com a disponibilidade de equipamentos de fotografia digital a custos muito acess´ıveis, a maioria das pessoas capta imagens e v´ıdeos digitais a um ritmo elevado, sendo muito desse conteúdo partilhado através de canais como o youtube ou facebook.

Também ao n´ıvel da comunica¸cão social, nomeadamente escrita, televisiva, entre outras, o uso da fotografia digital é comummente utilizada, e enquanto no passado se podia confiar nos dados apresentados por esses meios, com a evolu¸cão da tecnologia, hoje em dia vivemos num mundo onde não podemos acreditar em tudo o que vemos ou ouvimos. Actualmente a tecnologia está de tal maneira avan¸cada, que qualquer pessoa pode com relativa facilidade alterar dados multimédia digitais, como por exemplo, alterar uma imagem (um exemplo pode ser visto na Figura. 1.1).

Figura 1.1: Exemplo de uma imagem de um soldado britânico em Basra, Iraque, alterada digitalmente. A imagem da esquerda foi publicada na primeira página do jornal Los Angeles Times em 2003 e provou-se resultar da composi¸cão da imagem do centro e da direita [4]

Durante os últimos anos, surgiu uma nova área de investiga¸cão no campo do processa-mento de sinal designada por image forensics. O objectivo é voltar a restaurar a confian¸ca dos dados digitais de modo a garantir que os mesmos não foram alterados após a aquisi¸cão. Alguns trabalhos cient´ıficos foram propostos nesta área, dos quais destacamos [5], [6], [7].

Nesta disserta¸cão iremos estudar o problema da deteçcão de altera¸cões feitas em imagens digitais, apresentando um resumo dos vários métodos propostos na literatura e alguns resul-tados experimentais que exemplificam a aplica¸cão de alguns desses métodos.

(20)

Para melhor se perceber o problema, vamos come¸car por apresentar alguns conceitos sobre imagem digital e apresentar algumas das altera¸cões que podem ser efectuadas nas imagens e que se revelam impercept´ıveis ao olho humano, sendo necessário algoritmos de processamento de imagem para a sua deteçcão.

Uma imagem digital não é mais do que uma matriz de pontos, definidos por valores numéricos, onde cada um desses pontos vai ser denominado p´ıxel. Nesta disserta¸cão uti-lizamos imagens em formato RGB. O RGB é um sistema aditivo de cores formado por Ver-melho (Red), Verde (Green) e Azul (Blue), onde todas as outras cores são obtidas através de combina¸cões destas três. Cada um dos p´ıxeis é composto por um conjunto de três valores, sendo cada um deles reprentado por 8 bits (pode variar entre 0 e 255) que representam cada uma das cores. Assim sendo o vermelho num p´ıxel não é mais do que o vector (255,0,0).

O processo de aquisi¸cão de uma imagem num aparelho de capta¸cão (Figura 1.2) é o seguinte. A luz passa através da lente e do filtro óptico e é capturada pelos sensores de cor. A maioria das máquinas digitais usa um array de filtros de cor ”Color Filter Array”para retratar o mundo real. O CFA consiste num array de sensores de cor, onde cada qual captura a cor correspondente do mundo real numa localiza¸cão aproximada do p´ıxel. Depois de obtida a informa¸cão pelo CFA, esta é guardada e os restantes p´ıxeis são interpolados usando os p´ıxeis vizinhos. Depois de interpoladas, as três imagens correspondentes às componentes vermelho, verde e azul, passam através de um bloco de pós-processamento. Este bloco depende do modelo da máquina, contendo por exenplo, o balanceamento de brancos. Por fim a imagem pode sofrer uma compressão JPEG para reduzir o espa¸co de armazenamento [2].

Figura 1.2: Processo de capta¸c˜ao de uma imagem[2].

Existem muitas e variadas maneiras de proceder a altera¸cões numa imagem, entre elas a clonagem, que consiste em copiar um peda¸co da imagem para outro lugar na mesma imagem, de modo a ocultar pessoas ou objectos, como podemos ver na Figura 1.3. Outros exemplos de altera¸cões de uma imagem são, por exemplo, redimensionamento, isto é, aumentar ou diminuir o seu tamanho, rota¸cão, etc. Estes tipos de altera¸cões são mais utilizados quando são unidas duas ou mais imagens. Por exemplo, como muitas vezes aparece em revistas, dois famosos (jogadores de futebol, apresentadores de televisão, etc.), onde se diz que estão numa rela¸cão amorosa e aparece uma imagem com esses mesmos famosos de mão dada na praia [8].

(21)

Figura 1.3: A imagem da esquerda foi alterada de maneira a esconder o contentor, resultando na imagem da direita [9].

1.1 Contribui¸

c˜

oes desta tese

Ao longo desta tese vamos realizar um estudo sobre os métodos existentes para detectar altera¸cões numa imagem. Vamos descrever as várias formas como uma imagem pode ser al-terada e descrevemos também as diferentes maneiras de como detectar as referidas altera¸cões. Implementámos dois algoritmos para assim aprofundar o estudo de duas formas de detectar altera¸cões numa imagem. Desta forma foi poss´ıvel verificar a eficácia dos ditos algoritmos, através da demonstra¸cão dos resultados obtidos.

O primeiro algoritmo é usado para detectar altera¸cões do tipo clonagem, descrito em cima. O método utilizado é baseado na correla¸cão entre os p´ıxeis da imagem, isto é, estuda-se a forma como cada p´ıxel se relaciona com os outros p´ıxeis.

O segundo algoritmo é utilizado para descobrir se as imagens foram, por exemplo, redimen-sionadas ou rodadas. Este algoritmo utiliza um método de deteçcão baseado no tipo de rela¸cão que os vários planos binários da imagem têm entre si.

Em termos de trabalho futuro, o trabalho aqui desenvolvido é um bom ponto de partida para quem desejar seguir a área da análise forense de imagens digitais. A partir deste trabalho é poss´ıvel abordar o desenvolvimento de algoritmos mais complexos, visto que esta é uma área que ainda tem muito por descobrir.

1.2 Estrutura da tese

Esta disserta¸cão está estruturada em 5 cap´ıtulos. No Cap´ıtulo 2 apresentamos o que foi feito nos últimos anos sobre como detectar altera¸cões em imagem digital, isto é, descrevemos como os diferentes tipos de altera¸cões são efectuados assim como as técnicas existentes ac-tualmente para detectar esses tipos de altera¸cões. No Cap´ıtulo 3 vamos descrever com maior detalhe um algoritmo de deteçcão de altera¸cães em imagens, mais propriamente, o algoritmo que detecta a cópia de um ou mais peda¸cos de uma imagem para outro lado da mesma im-agem. Este algoritmo é baseado no estudo da forma como os p´ıxeis se correlacionam entre si. No Cap´ıtulo 4 é apresentado um algoritmo para a deteçcão de imagens que sofreram um tipo de altera¸cão que consiste em, por exemplo, redimensionar e/ou rodar uma imagem. Este algoritmo estuda a correla¸cão entre os planos binários da imagem. No Cap´ıtulo 5 são descritas todas as conclusões retiradas do trabalho desenvolvido.

(22)

(23)

Cap´ıtulo 2

Estado da arte

Neste cap´ıtulo vai ser abordado o que até aqui foi feito na área da imagem digital forense, que é um conjunto de técnicas que ajudam na deteçcão de falsifica¸cões/adultera¸cões em im-agens digitais. Neste cap´ıtulo descrevemos a forma de altera¸cão das imim-agens e os algorit-mos utilizados para a descoberta dessa mesma altera¸cão. As técnicas usadas na deteçcão de altera¸cões nas imagens podem ser divididas em vários grupos, de acordo com o tipo de informa¸cão que é analisada nas imagens [10].

De acordo com a informa¸cão que é retirada da imagem, os gupos referidos são cinco: • Informa¸cão retirada dos p´ıxeis da imagem (Seçcão 2.1).

• Informa¸cão sobre o formato da imagem (Seçcão 2.2). • Informa¸cão relativa à captura da imagem (Seçcão 2.3). • Informa¸cão baseada no ambiente f´ısico (Seçcão 2.4). • Informa¸cão baseada na geometria (Seçcão 2.5).

2.1 Informa¸

c˜

ao retirada dos p´ıxeis da imagem

Nesta seçcão vamos descrever quatro técnicas que analisam directa ou indirectamente correla¸cões ao n´ıvel do p´ıxel, que correspondem a uma forma especifica de altera¸cão.

2.1.1 Clonagem

Consiste em copiar partes de uma imagem e coloc´a-las noutro lado da mesma imagem, normalmente para ocultar uma pessoa ou objecto (Figura 2.1).

Para detectar este tipo de adultera¸cão, primeiro divide-se a imagem em blocos. Depois de termos a imagem em blocos, existem duas maneiras de efectuar a análise. A primeira consiste em aplicar uma transformada discreta do coseno (DCT) [9]; a segunda em aplicar a análise em componentes principais (PCA) [5]. O PCA tem como objectivo produzir uma representa¸cão de dimensão mais reduzida, enquanto que a DCT tem como propriedade que a informa¸cão visual mais importante seja concentrada em apenas alguns coeficientes. Em ambos os casos colocam-se todos os blocos numa matriz, onde cada linha da matriz é um bloco. De seguida ordenam-se lexicograficamente todas as linhas da matriz, onde os blocos semelhantes são pares

(24)

adjacentes na lista ordenada. O maior n´umero de blocos semelhantes ´e por fim marcado na imagem.

A aplica¸c˜ao da DCT e do PCA, em cada um dos casos, serve para reduzir a complexidade computacional. Um estudo mais aprofundado do caso onde se utiliza a DCT vai ser abordado no Cap´ıtulo 3.

Figura 2.1: A imagem da esquerda foi alterada para esconder o jeep [9].

2.1.2 Reamostragem

Normalmente, as altera¸cões em imagens digitais são feitas copiando uma parte de uma imagem e colando-a noutra imagem. Para isso torna-se necessário rodar ou redimensionar a parte da imagem que se vai colar (Figura 2.2). Isso envolve reamostrar a imagem colada no espa¸co de amostragem da imagem hospedeira, o que vai introduzir correla¸cões espec´ıficas periódicas entre os p´ıxeis da imagem. Este método não deixa nenhum vest´ıgio percept´ıvel. Para come¸car vamos então explicar como se efectua a reamostragem de um sinal, usando-se como exemplo um sinal de uma dimensão (1-D). Supondo que temos um sinal x[t] com m amostras, o sinal pode ser aumentado/diminuido com um factor p_q para n amostras em três passos [11] [8]:

• Reamostrar para cima: criar um novo sinal xu[t] com pm amostras, inserindo p −1 zeros depois de cada x[t], com t=1,2,...m.

• Interpolar: convoluir o sinal xu[t] com um filtro passa baixo (atenua/reduz as frequˆencias mais elevadas), xi[t] = xu[t] ∗ h[t].

• Reamostrar para baixo: criar um novo sinal com n amostras, onde y[t] = xi[qt], t=1,2,...n.

Um simples exemplo do que foi descrito anteriormente pode ser redimensionar um sinal x[t] com um factor de 2₁, usando interpola¸cão linear, para produzir y[t]. As amostras ´ımpares do sinal reamostrado vão ficar com os valores do sinal original: y[2i − 1] = x[i], i = 1, 2, ..m. As amostras pares vão ser a média dos valores dos vizinhos adjacentes do sinal original: y[2i] = 0.5x[i] + 0.5x[i + 1]. Com isto podemos verificar que os p´ıxeis interpolados podem ser expressos a partir das amostras reamostradas : y[2i] = 0.5y[2i − 1] + 0.5y[2i + 1].

Para detectar este tipo de altera¸cões em imagens, se for conhecida a forma como os p´ıxeis se correlacionam com os seus vizinhos, é fácil determinar que p´ıxeis se correlacionam entre si. Por outro lado, se conhecermos os p´ıxeis que se correlacionam, é simples obter a

(25)

forma de correla¸cão. Na prática, normalmente não se conhece nem uma coisa nem outra. Nesse caso, vai ser utilizado um algoritmo de expectativa/maximiza¸cão (EM), que é um algoritmo iterativo de duas etapas, que estima simultaneamente o conjunto de p´ıxeis que se correlacionam com os seus vizinhos (1) e a forma como se correlacionam (2). Em (1) é utilizado um estimador Bayesiano enquanto que em (2) é utilizada uma estimativa dos m´ınimos quadrados ponderados.

Figura 2.2: Foi inserida uma nova chapa de matr´ıcula. Para isso a imagem inserida teve de ser redimensionada [8].

2.1.3 Jun¸c˜ao

A jun¸cão de imagens consiste em copiar e colar partes de uma imagem, na mesma ou noutra imagem, sem qualquer tipo de pós-processamento. Esta é a opera¸cão básica de uma montagem fotográfica, mas que se for feita com cuidado, as bordas da jun¸cão são imper-cept´ıveis ao olho humano. Este tipo de adultera¸cão interrompe as estat´ısticas de Fourier de ordem superior [10], que podem ser usadas para detectar se as imagens foram modificadas.

O biespectro B(ω1, ω2) = X(ω1)X(ω2)X∗(ω1+ ω2) mede as correla¸c˜oes de ordem superior entre as frequˆencias ω1, ω2e(ω1+ ω2), onde X(ω) denota a transformada de Fourier e X∗(ω) o seu conjugado.

Apesar da jun¸cão entre imagens ser feita em duas dimensões, esta altera¸cão na imagem é detectada aplicando a análise anterior a sinais de uma dimensão, obtidos através de cortes verticais e horizontais da imagem alterada. Um sinal composto pela jun¸cão de dois segmentos de sinais, muito provavelmente introduz descontinuidades ou mudan¸cas abruptas no ponto da jun¸cão [12]. Estas descontinuidades são usadas para determinar se a imagem foi ou não modificada.

2.1.4 Estat´ısticas

Existem muitas formas de modificar uma imagem, como por exemplo, redimensiona-mento, ajuste de brilho, rota¸cão, entre outras. Para detectar estes tipos de altera¸cão existem dois métodos que podem ser utilizados: um método baseado nas correla¸cões entre os planos binários da imagem [6], método que vai ser descrito com maior detalhe no Cap´ıtulo 4; um método baseado na decomposi¸cão do espa¸co de frequências [13].

O primeiro método, baseia-se na ideia de que as correla¸cões entre os planos binários vão diferir entre uma imagem alterada e uma imagem original. Come¸ca-se por dividir a imagem de

(26)

acordo com os seus planos binários e em seguida calculam-se as Binary Similarity Measures, que são as correla¸cões entre os planos binários. A segunda técnica citada anteriormente, ex-plora as regularidades estat´ısticas das imagens naturais. Em primeiro decompõe-se o espa¸co de frequência em várias sub-bandas. O modelo estat´ıstico é composto pelos primeiros quatro momentos estat´ısticos de cada uma das sub-bandas e as estat´ısticas de ordem superior, que capturam as correla¸cões entre as várias sub-bandas. Por momentos estat´ısticos entende-se: cálculo do valor médio, dispersão dos dados, simetria dos dados e concentra¸cão dos dados em torno do valor médio.

Em ambos os métodos é utilizado um classificador para determinar, com base nos mo-mentos estat´ısticos retirados da imagem, se uma imagem sofreu ou não modifica¸cões.

2.2 Informa¸

c˜

ao sobre o formato da imagem

Nos dias de hoje, as câmaras digitais exportam as suas imagens para o formato JPEG. Este método permite alguma flexibilidade na quantidade de compressão obtida [14]. Nesta seçcão vamos falar um pouco de três técnicas que exploram detalhes introduzidos pela compressão com perdas JPEG.

2.2.1 Quantiza¸c˜ao JPEG

O esquema de compressão JPEG come¸ca por converter uma imagem de três canais de cores (RGB) para o espa¸co de luminância / crominância (YCbCr). Cada um dos canais é depois particionado em blocos de pixeis de 8x8. Estes valores são convertidos de valores sem sinal para valores com sinal. Cada um dos blocos obtidos anteriormente é convertido para o espa¸co de frequência usando a transformada discreta do coseno (DCT), e de seguida, cada coeficiente da DCT, c, é quantizado com um valor q: cq = round(c_q). Por fim é empregue uma codifica¸cão da entropia. Esta sequência de passos é utilizada pelas máquinas fotográficas/v´ıdeo e pelos programas de edi¸cão, com algumas varia¸cões, como por exemplo a forma de quantiza¸cão. A forma de detectar se uma imagem no formato JPEG foi alterada, passa por pegar na imagem e retirar a tabela de quantiza¸cão e compará-la com as tabelas de quantiza¸cão das máquinas digitais e dos programas de edi¸cão. Para esta técnica de deteçcão é necessário saber as tabelas de quantiza¸cão que as máquinas fotográficas digitais e os programas de edi¸cão utilizam para comprimir as imagens em JPEG [14].

2.2.2 Duplo JPEG

O problema do JPEG duplo surge quando uma imagem é descomprimida (por exemplo, quando se abre a imagem com um programa de edi¸cão) e em seguida é guardada outra vez com uma matriz de quantiza¸cão diferente. A compressão dupla resulta, na maioria das vezes, de quando uma por¸cão de uma imagem é substitu´ıda por um bocado de outra imagem. Neste caso, quando se guarda a imagem, o peda¸co de imagem que foi colado na outra vai apresen-tar caracter´ısticas de uma só compressão enquanto o resto da imagem vai apresentar tra¸cos relativos a duas compressões. Este tipo de observa¸cão pode ser usado para detectar áreas manipuladas em imagens digitais.

(27)

A compressão dupla JPEG pode ser representada por uma compressão seguida de uma descompressão e uma segunda compressão. A descompressão funciona de maneira contrária à compressão, apresentada na Seçcão 2.2.1. Em primeiro lugar, para cada bloco, os coeficientes quantizados obtidos a partir do ficheiro são multiplicados pelos coeficientes de quantiza¸cão guardados na matriz de quantiza¸cão. Depois é calculada a IDCT (o inverso da DCT) e por ´

ultimo os valores são arredondados para inteiros e truncados para o intervalo [0,255]. Na compressão dupla, a compressão JPEG é realizada duas vezes, com matrizes de quantiza¸cão diferentes. Na imagem original JPEG, os coeficientes da DCT são quantizados com uma matriz de quantiza¸cão, pelo que o valor do coeficiente da DCT vai ser múltiplo do coeficiente de quantiza¸cão. Aquando da descompressão, como já foi dito, os p´ıxeis vão ser arredondados e truncados para inteiros no intervalo [0,255]. A segunda compressão vai ser feita a partir dos valores arredondados e truncados, o que vai fazer com que os coeficientes percam os seus valores inteiros e deixem de ser múltiplos da primeira matriz de quantiza¸cão, mas esses valores vão ficar espalhados em torno desses múltiplos. Por fim os coeficientes vão ser quantizados com a segunda tabela de quantiza¸cão.

A concentra¸cão dos coeficientes em torno dos múltiplos da primeira matriz de quantiza¸cão e a seguinte quantiza¸cão com a segunda matriz vai criar padrões nos histogramas dos coe-ficientes da DCT que podem ser usados para identificar o primeiro factor de quantiza¸cão. Quando a primeira matriz de quantiza¸cão é superior à segunda matriz de quantiza¸cão, alguns múltiplos da segunda matriz de quantiza¸cão desaparecem dos histogramas. No caso contrário, alguns múltiplos da segunda matriz de quantiza¸cão formam máximos e m´ınimos locais. Esses pontos desaparecidos e os máximos/m´ınimos são então utilizados para identificar a primeira matriz de quantiza¸cão e assim provar que a imagem sofreu duas compressões JPEG [15].

Contudo, esta é uma abordagem que não vai poder provar a existência de altera¸cões numa imagem digital, uma vez que é poss´ıvel guardar-se uma imagem inadvertidamente depois de simplesmente a ter vizualizado [10].

2.2.3 Artefactos de bloco no JPEG

O formato JPEG é usado na maioria das máquinas digitais e programas de processamento de imagem. Normalmente a compressão JPEG introduz artefactos de bloco, que resultam do facto da compressão JPEG utilizar blocos de 8x8 pixéis e cada um desses blocos ser proces-sado individualmente no cálculo da DCT e quantiza¸cão. Os fabricantes de máquina digitais e programas de processamente utilizam diferentes tabelas de quantiza¸cão, o que vai causar diferentes artefactos de bloco. Quando se efectua algum tipo de altera¸cão numa imagem, a imagem alterada vai ficar com diferentes tipos de artefactos de compressão provenientes de diferentes fontes. Este tipo de inconsistências nos artefactos serve para atestar a não integri-dade de uma imagem.

Os artefactos de bloco s˜ao calculados da seguinte maneira:

B(i) = 64 X k=1 D_{(k) − Q(k)round} D(k) Q(k) ,

(28)

posi¸cão k e Q é a tabela de quantiza¸cão estimada. A medida do artefacto de bloco (BAM) é dada por: BAM = _N1 P

iB(i), onde N ´e o n´umero de blocos total da imagem [16].

Figura 2.3: `A esquerda, uma imagem alterada e `a direita, artefactos de bloco detectados (BAM=2136.5) [16].

2.3 Informa¸

c˜

ao relativa `

a captura da imagem

Nesta seçcão vamos falar de quatro técnicas que exploram as caracter´ısticas introduzidas nos vários passos de aquisi¸cão de uma imagem.

2.3.1 Desvio crom´atico

A maioria das imagens contém uma variedade de desvios cromáticos que resultam de im-perfei¸cões nos sistemas ópticos das câmaras digitais. Num sistema ideal, a luz passa através de uma lente para um ponto único no sensor. No entanto, o sistema óptico desvia-se do modelo ideal, no modo em que não consegue focar a luz perfeitamente para todos os comprimentos de onda. Isto faz com que exista um efeito conhecido como desvio cromático que ocorre em duas formas: longitudinal e lateral. O desvio longitudinal manifesta-se nas diferen¸cas nos planos de foco para os diferentes comprimentos de onda da luz. O desvio lateral manifesta-se através de um deslocamento nas localiza¸cões onde a luz de diferentes comprimentos de onda alcan¸ca o sensor (deslocamento proporcional à distância para o centro óptico). O desvio longitudinal pode ser modelado como uma convolu¸cão dos canais de cor individuais com um filtro passa baixo adequado. O desvio lateral pode ser modelado como uma expansão/contraçcão dos canais de cor em rela¸cão uns aos outros. Quando se altera uma imagem, estes devios são muitas vezes perturbados e deixam de ser consistentes ao longo da imagem. De seguida vai ser descrita uma forma de estimar o desvio cromático lateral.

Para come¸car podemos dizer que, nas ópticas clássicas, a refraçcão da luz entre duas superf´ıcies é descrita pela lei de Snell: n sin(θ) = nf(θf), onde θ é o ângulo de incidência, θf é o ângulo de refraçcão e n e nf são os ´ındices de refraçcão das superf´ıcies pelas quais a luz passa. O ´ındice de refraçcão do vidro, θf, depende do comprimento de onda que o atravessa. Esta dependência implica que uma luz policromática seja separada de acordo com o comprimento de onda que deixa a lente e chega ao sensor. O resultado desta separa¸cão da luz denomina-se desvio cromático lateral. Considerando como exemplo a Figura 2.5, podemos verificar a posi¸cão no sensor dos diferentes comprimentos de onda, onde xrmostra a posi¸cão de

(29)

um comprimento de onda baixo (vermelho) e xb a posi¸cão de um comprimento de onda longo (azul). No caso de não existir desvio cromático lateral, estas posi¸cões devem ser coincidentes, caso contrário podem ser modeladas por xr ≈ αxb, onde α é um valor escalar. Para sensores e lentes de duas dimensões, o desvio cromático pode ser modelado por xr, yr ≈ α(xb, yb). Podemos ver na Figura 2.6 a representa¸cão baseada em vectores deste tipo de desvio onde cada vector é ~v = (xr− xb, yr− yv). Este modelo não é mais do que uma expansão/contraçcão em redor do centro da imagem. Com isto, podemos descrever a posi¸cão do centro através de (x0, y0), ficando então

xr = α(xb− x0) + x0yr= α(yb− y0) + y0.

Uma vez que o desvio cromático lateral resulta num desalinhamento (expansão ou con-traçcão) entre os canais de cor de uma imagem, este modelo vai maximizar o alinhamento dos canais de cor, mais especificamente a informa¸cão entre os canais vermelho e verde e da mesma forma entre os canais azul e verde. As estimativas local e global dos desvios cromáticos são depois comparadas para detectar altera¸cões nas imagens.

Figura 2.4: À esquerda, uma imagem original e à direita uma imagem alterada. Blocos verdes denotam regiões que estão consistentes com os desvios globais estimados, os blocos vermelhos não estão [17].

Figura 2.5: Refraçcão da luz numa dimensão. Uma luz policromática entra na lente num ângulo θ e emerge num ângulo que depende do comprimento de onda. Diferentes comprimen-tos de onda chegam ao sensor em poncomprimen-tos diferentes xr e xb [17].

(30)

Figura 2.6: Refraçcão da luz em duas dimensões. Uma luz policromática entra na lente num ângulo θ e emerge num ângulo que depende do comprimento de onda. Diferentes comprimen-tos de onda chegam ao sensor em poncomprimen-tos diferentes [17].

2.3.2 Arrays de filtros de cor

Hoje em dia, a sofistica¸cão e baixo custo das tecnologias digitais, tanto hardware como software, faz com que estas sejam parte integrante do nosso dia-a-dia. A facilidade de criar, editar e alterar imagens sem deixar nenhuma suspeita, faz com que a credibilidade das ima-gens digitais seja pouco ou mesmo nenhuma. Posto isto, são necessárias técnicas para detectar a fonte da imagem, isto é, a câmara com a qual a imagem foi obtida. Em seguida vamos de-screver uma técnica que permite descobrir a origem da imagem, explorando a interpola¸cão na superf´ıcie de cor devido ao uso de arrays de filtros de cor (CFA).

De forma a entender melhor o problema, vamos come¸car por descrever a forma como uma imagem é formada numa câmara digital. O modo geral está explicado no Cap´ıtulo 1 e na Figura 1.2. Vamos explicar a parte dos sensores em maior detalhe. Após a luz passar através da lente, esta é filtrada e focada num CCD (charge-coupled device), que é um disposito que integra a luz incidente em todo o espectro e a tranforma num sinal eléctrico. Uma vez que o CCD é mono-cromático, são necessários vários CCD, um para cada elemento de cor. Devido ao facto de os CCD serem muito caros, o CCD é organizado num padrão usando diferentes filtros espectrais, sendo o RGB o mais usado. A este método chama-se array de filtros de cor (CFA). Com isto, para cada p´ıxel só uma amostra de cor vai ser guardada, sendo as outras duas estimadas a partir das amostras vizinhas, de modo a obter uma imagem com três canais de cor. A este passo chama-se demosaicking ou interpola¸cão, que é normalmente realizada aplicando uma matriz ponderada (kernel) à vizinhan¸ca do valor em falta.

Uma vez que numa câmara digital tradicional os canais RGB estão fortemente interpo-lados, é proposto um algoritmo de expectativa/maximiza¸cão (EM), de modo a detectar os vest´ıgios da interpola¸cão. O algoritmo EM é baseado em dois passos, o de expectativa, que está relacionado com as variáveis desconhecidas subjacentes e que usa as estimativas actuais dos parâmetros, e o passo de maximiza¸cão, que fornece uma nova estimativa dos parâmetros, sendo estas etapas iteradas até convergirem. Com este algoritmo são geradas duas sa´ıdas, uma delas um mapa de probabilidade (array de duas dimensões) onde cada entrada mostra a semelhan¸ca entre cada p´ıxel da imagem e um de dois grupos de amostras, sendo estes os dos p´ıxeis correlacionados com os vizinhos e os dos que não estão correlacionados. A outra sa´ıda é a estimativa dos coeficientes de interpola¸cão, que é a contribui¸cão de cada p´ıxel para

(31)

o kernel de interpola¸cão. Numa imagem sem altera¸cões, espera-se que um padrão periódico de p´ıxeis esteja correlacionado com os seus vizinhos, enquanto que numa imagem que sofreu altera¸cões isso não se vai verificar [18].

2.3.3 Resposta da cˆamara

Aqui vamos descrever um método que detecta altera¸cões em imagens, verificando a con-sistência das caracteristicas da câmara digital ao longo de diferentes áreas da imagem, mais concretamente a resposta da câmara, camera response function (CRF). O tipo de altera¸cão que este método cobre é aquele onde se cola numa imagem um peda¸co vindo de outra imagem. Este método assenta no facto de as imagens alteradas conterem normalmente áreas suspeitas com caracter´ısticas diferentes de outras áreas da mesma imagem. Para detectar as referidas áreas são necessárias duas solu¸cões: uma segmenta¸cão da imagem e uma recupera¸cão das caracter´ısticas da câmara digital em cada área.

Para partir a imagem, vai ser necessário indicar previamente o número de segmentos, que convém estar entre 2 e 20, para as fronteiras entre segmentos serem suficientemente largas. Em seguida, cada segmento dessas fronteiras vai ser dividido em várias categorias: (1) autênticos, quando os dois lados do segmento pertencem à mesma câmara; (2) unidos, quando cada um dos lados do segmento pertence a câmaras diferentes; (3) amb´ıguos: quando um ou os dois lados do segmento contêm caracter´ısticas de duas câmaras.

Vamos agora descrever os passos para estimar a CRF da câmara (Figura 2.7). A CRF transforma a irradia¸cão r da luz em brilho R, utilizando o modelo da curva generalizada gama (GGCM) através da fórmula:

R = f (r) = rPni=0αiri_.

Em seguida são utilizados os pontos planares de irradia¸cão local (LPIPs) para extrair informa¸cão relacionada com a CRF, através de r = ax + by + c. Aplicando as derivadas parciais de segunda ordem na irradia¸cão ficamos com

Rxx R2 x = Rxy Rxry = f′′(r) f′_(r)2 = f′′_(f−1_(R)) (f′_(f−1_(R)))2,

a que vamos chamar de A(R). A partir daqui tiramos a geometria invariante (GI)

Q(R) = 1

1 − A(R)R.

A primeira ordem da GGCM Q(R) relaciona-se com os parˆametros da CRF usando Q(R) = (α1rln(r) + α1r+ α0)

2 α0− α1r

.

Para estimar a CRF, em primeiro lugar extrai-se as LPIPs, em seguida calculamos as GIs, e iterativamente procuramos os melhores parˆametros GGCM para ajustar os valores da GI.

No final é verificada a consistência dos segmentos, calculando os erros de ajuste, utilizando as estimativas CRF e GI (valores Q e R). Para a decisão final, os valores são passados por um classificador previamente treinado.

(32)

Figura 2.7: Passos para estimar a CRF da cˆamara [19].

2.3.4 Sensor de ru´ıdo

Durante todo o processo, desde o sensor da câmara até à imagem estar gravada na memória, existem variados passos (quantiza¸cão, balanceamento de brancos, entre outros), o que introduz um tipo de assinatura distinta na imagem. O propósito deste método centra-se no uso das caracter´ısticas do ru´ıdo precentra-sente nas imagens digitais para analisar centra-se uma imagem é ou não alterada. A ideia neste caso parte do princ´ıpio que as altera¸cões feitas numa imagem mudam as estat´ısticas do ru´ıdo na imagem de modo espec´ıfico, mudan¸cas essas que podem servir para uma análise forense.

De seguida, vamos descrever as três metodologias utilizadas para estimar as caracter´ısticas do ru´ıdo numa imagem. Em primeiro lugar é usado um algoritmo de denoising (redu¸cão de ru´ıdo) Figura 2.8 (a), que consiste em dada uma imagem I, obter-se a versão ID, com menos ru´ıdo. A estimativa do ru´ıdo da imagem nI no p´ıxel (i, j) é obtida a partir de nI(i, j) = I_{(i, j) − I}D(i, j). Sendo

e(i, j) = log₂_(|nI(i, j)|),

a média e o desvio padrão de e(i, j) formam o primeiro conjunto de caracter´ısticas, f1(I) e f2(I). O segundo conjunto de caracter´ısticas é obtido a partir da análise em sub-bandas, Figura 2.8 (b). Uma imagem é decomposta em quatro sub-bandas, denominadas baixo-baixo (LL), baixo-alto (LH), alto-baixo (HL) e alto-alto (HH). A sub-banda LL vai conter componentes de baixa frequência, enquanto que as outras três contêm componentes de alta frequência. A partir daqui, extra´ımos as fun¸cões estat´ısticas do ru´ıdo no dom´ınio da frequência.

Para isso, normaliza-se a imagem, efectua-se a sua decomposi¸cão e obtemos as três sub-bandas de alta frequência. Em seguida, para cada uma dessas sub-sub-bandas, calculamos a média µy e o desvio padrão σy dos seus coeficientes. A terceira fun¸cão estat´ıstica, f3(I), vai ser o desvio padrão. Com a média µy e a variância σy2 obtemos uma distribui¸cão Gaussiana N(µy, σ2y). Sendo p(y) a fun¸cão densidade da distribui¸cão Gaussiana e q(y) a distribui¸cão dos coeficientes das sub-bandas, vamos quantizar o ajuste Gaussiano medindo a distância entre p(y) e q(y). Com isto vamos obter a quarta fun¸cão estat´ıstica do ru´ıdo,

f(4)(I) =X i p(yi) − q(yi) ∆y,

onde i ´e o indice da barra do histograma e ∆y ´e o tamanho da barra.

Através da previsão dos vizinhos, Figura 2.8 (c), vamos obter as últimas duas fun¸cões estat´ıstica do ru´ıdo. Dada uma imagem I, em primeiro lugar vamos identificar as suas regiões

(33)

suaves de acordo com os seus valores de gradiente. Depois de calcular os valores de gradiente, vamos normalizar a imagem. Comparando os valores de gradiente horizontais gh e verticais gv com um limite tg, identificamos p´ıxeis na região suave que pertencem aos dois gradientes. Colocando um limite no valor da intensidade do p´ıxel, a região suave é então partida em duas regiões distintas: uma escura e outra clara. Para cada uma das regiões vamos realizar a predi¸cão dos vizinhos. Vamos predizer cada valor do p´ıxel bi, numa dada região com um modelo linear nos oito vizinhos (ai,1− ai,8) ,

ˆ bi = 8 X k=1 xkai,k.

xk>0 é o peso associado a cada ai,k e a restri¸cão não-negativa indica uma correla¸cão positiva entre bi e os seus vizinhos. Dada uma região com N p´ıxeis, denota-se os valores destes p´ıxeis como um vector coluna b = [b1, b2, ..., bN]T e os coeficientes não negativos dos pesos como um vector coluna x = [x1, x2, ..., xN]T. Os p´ıxeis são representados como um vector linha e todos organizados numa matrix A de tamanho N × 8. Os pesos x são estimados usando um método dos minimos quadrados não negativo, minx =

Ax_{− b} , x_k > 0, k = 1, 2, ..., 8. De seguida s˜ao calculados os erros de predi¸c˜ao ∆b =

ˆb− b

. f(5)(I) e f(6)(I) vão ser a média e o desvio padrão de ∆b, respectivamente.

Depois de calculados todos os valores das fun¸cões estat´ısticas do ru´ıdo, estes são passados por um classificador, para determinar se a imagem é ou não falsificada [20].

Figura 2.8: Estimar as caracter´ısticas do ru´ıdo, (a) Algoritmo de denoising, (b) An´alise em sub-bandas, (c) Previs˜ao dos vizinhos [20].

2.4 Informa¸

c˜

ao baseada no ambiente f´ısico

Nesta seçcão vamos descrever três técnicas para estimar diferentes propriedades da luz ambiente, na qual uma pessoa ou objecto foi fotografado.

2.4.1 Direc¸c˜ao da luz 2-D

Quando se cria uma imagem, que é a jun¸cão de duas pessoas lado a lado, mas foram fotografadas em locais diferentes, é muito dif´ıcil combinar as condi¸cões da luz das fotografias

(34)

individuais na imagem final. As inconsistências da luz na imagem podem ser utilizadas para detectar tra¸cos de adultera¸cões numa imagem. Nesta seçcão vamos descrever como se pode estimar a direçcão do ponto de luz a partir de uma única imagem.

Para estimar a direçcão da luz numa imagem, come¸camos por fazer algumas suposi¸cões: (1) a superf´ıcie de interesse é Lambertiana (reflecte a luz uniformemente); (2) a superf´ıcie tem um valor de reflectância constante; (3) a superf´ıcie é iluminada por uma fonte pontual de luz infinitamente longe; A partir das suposi¸cões anteriores podemos expressar a intensidade da imagem através de

I(x, y) = R( ~N(x, y).~L) + A,

onde R é o valor da reflectância, ~L é um vector que aponta na direçcão da luz, ~N(x, y) é um vector que representa a normal à superf´ıcie no ponto (x, y) e A é uma constante da luz ambiente. Como só a direçcão da fonte de luz é que interessa, pode-se considerar que a reflectância tem o valor unitário. O objectivo é determinar o ponto de luz a partir de uma ´

unica imagem. Para isso, a componente z da normal `a superf´ıcie vai ser zero (Nz = 0) e as componentes x e y (Nx e Ny), v˜ao ser estimadas a partir da imagem, ficando a intensidade da imagem a ser representada por

I(x, y) = ~N(x, y).~L+ A = ( ~N(x, y) ~N(x, y))Lx Ly

+ A.

Usando no m´ınimo quatro pontos com a mesma reflectância, R, e distintas normais à superf´ıcie, ~N, a direçcão da luz e constante de ambiente podem ser obtidas pela estimativa padrão dos m´ınimos quadrados. A fun¸cão de erro quadrado, contendo a equa¸cão anterior, é

E(~L, A) = M   Lx Ly A  −      I(x1, y1) I(x2, y2) .. . I(xp, yp)      2 = M ~v−~b 2 , M =      Nx(x1, y1) Ny(x1, y1) 1 Nx(x2, y2) Ny(x2, y2) 1 .. . ... ... Nx(xp, yp) Ny(xp, yp) 1      ,

que pode ser minimizada para produzir

~v= (MTM)−1_MT_~b.

Este processo pode ser repetido para diferentes objectos ou pessoas presentes na imagem, de modo a verificar se existem inconsistˆencias na luz, e assim provar a modifica¸c˜ao da imagem.

2.4.2 Direc¸c˜ao da luz 3-D

Na Figura 2.10 podemos ver a imagem de um júri de um programa americano, que se confirmou tratar-se de uma montagem de várias fotografias, tiradas em diferentes condi¸cões de luz. Nesta seçcão vamos descrever um método que a partir de pontos que aparecem na retina do olho (que ao longo da descri¸cão vamos chamar de realce) vai estimar a direçcão para

(35)

Figura 2.9: Na imagem as setas brancas representam as estimativas individuais das direçcões da fonte de luz e a amarelo a estimativa final (média de todas) [7].

a fonte de luz. Inconsistências na estimativa da direçcão da fonte de luz a partir de diferentes olhos, bem como diferen¸cas na forma e na cor desses realces nos olhos, provam que houve falsifica¸cão na imagem.

Figura 2.10: Imagem do júri de um progrma americano, que é uma composi¸cão de várias imagens. As inconsistências na forma e posi¸cão do realce (pequeno ponto branco na iris) nos olhos, sugere que foram fotografados em condi¸cões de luz diferentes [21].

A Figura 2.11, mostra a geometria básica da refleçcão da luz no olho humano. No di-agrama, os três vectores ~L, ~N e ~R correspondem à direçcão da luz, à normal à superf´ıcie no ponto onde o realce é formado e à direçcão na qual o realce vai ser observado. A lei da reflexão diz que um raio de luz é reflectido de uma superf´ıcie com um ângulo de reflexão θr igual ao ângulo de incidência θi onde os ângulos são medidos em rela¸cão à normal à superf´ıcie

~

N. Assumindo vectores unit´arios, o raio reflectido, ~R, pode ser descrito por ~

R= ~L+ 2(cos(θi) ~N − ~L) = 2 cos(θi) ~N − ~L. (2.1) Se assumirmos um reflector perfeito, ent˜ao fica

~

L= 2 cos(θi) ~N − ~V = 2(~VTN~) ~N − ~V . (2.2) A direçcão da luz ~L pode por isso ser estimada a partir da normal à superf´ıcie ~N e a direçcão do espectador num realce no olho.

Esta estimativa da direçcão da luz pode ser comparada através das várias pessoas numa imagem ou mesmo com a estimativa obtida com o método descrito na seçcão anterior.

(36)

Figura 2.11: Forma¸cão do realce (pequeno ponto branco na iris) no olho. A posi¸cão do realce é determinada pela superf´ıcie normal, ~N, e as direçcões relativas para a fonte de luz, ~L, e espectador, ~V, [21].

2.4.3 Luz ambiente

Como descrevemos nas seçcões anteriores, aqui vamos decrever outra técnica que se baseia em inconsistências na ilumina¸cão para provar a existência de altera¸cões numa imagem. A ilumina¸cão de uma cena pode ser complexa, qualquer número de luzes podem ser colocadas em muitas posi¸cões, criando assim diferentes ambientes de ilumina¸cão.

Come¸ca-se por supor que a aparˆencia de uma superf´ıcie Lambertiana pode ser expressa por

E( ~N) = 2 X n=0 n X m=−n ˆ rnln,mYn,mN ,~

onde E( ~N) é a irradiância com a normal à superf´ıcie ~N, ˆrnsão constantes conhecidas, Yn,m(.) são fun¸cões harmónicas esféricas e ln,m são os pesos lineares desconhecidos dessas fun¸cões. Os harmónicos esféricos formam uma base ortonormal de fun¸cões seccionalmente cont´ınuas sobre a esfera e são análogas à base de Fourier na linha ou plano. Esta é uma expressão linear em nove coeficientes da luz ambiente, l0,0 a l2,2 e podem ser estimados utilizando a estimativa dos m´ınimos quadrados, mas é uma solu¸cão que vai necessitar de uma superf´ıcie normal de três dimensões proveniente de pelo menos nove pontos da superf´ıcie de um objecto.

No caso de não ser poss´ıvel satisfazer o requerimento anterior, considera-se só a fronteira de oclusão de um objecto, resultando em

E( ~N) = l_1,−12π 3 Y1,−1N~ + l1,1 2π 3 Y1,1N~ + l2,−2 π 4Y2,−2N~ + l2,2 π 4Y2,2N~ + l0,0 π 2√π − l2,0 π 16 r π 5. Aqui Yi,j(.) depende apenas dos componentes x e y da normal à superf´ıcie ~N. Posto isto, os cinco coeficientes da luz podem ser estimados a partir da normal à superf´ıcie de duas dimensões, usando o método dos m´ınimos quadrados.

Os coeficientes podem no fim ser comparados, de forma a detectar inconsistˆencias na luz dentro da imagem.

(37)

2.5 Informa¸

c˜

ao baseada na geometria

Nesta seçcão vamos referir técnicas que se baseiam em formas geométricas. Um dos assun-tos estudados por estas técnicas é como determinar diferen¸cas no ponto principal (projeçcão do centro da câmara no plano da imagem) a partir dos olhos humanos (dois c´ırculos) ou outras formas geométricas. Outro dos assuntos estudados por estas técnicas é a partir de ferramentas de geometria progressiva rectificar superf´ıcies planas, como por exemplo, explo-rando conhecimentos de pol´ıgonos de forma conhecida.

Em imagens que nunca foram modificadas, o ponto principal é muito próximo do centro da imagem. Quando um objecto é movido na imagem, o ponto principal é movido propor-cionalmente. A limbus, a fronteira entre a ´ıris e a esclerótica, pode ser modelada como um c´ırculo. Consideremos a projeçcão de um par de olhos, que se assume serem complanares. Neste caso, a passagem do mundo real para as coordenadas da imagem, pode ser modelada com uma matriz de projeçcão planar H : ~x = H ~X, onde os pontos reais, ~X e os pontos da imagem, ~x são representados por vectores de duas dimensões. A transforma¸cão H pode ser estimada a partir da geometria conhecida dos olhos de uma pessoa e obtida no producto de matrizes que engloba os parâmetros internos e externos da câmara digital

H= λ   f 0 c1 0 f c2 0 0 1   r~₁ r~₂ ~t ,

onde λ é um factor escalar, a matriz mais à esquerda é a matriz interna (onde f é o tamanho focal e (c1, c2) é o ponto principal) a matriz que engloba a transforma¸cão entre o mundo real e as coordenadas da câmara. Depois de se obter, a matrix interna produz a estimativa do ponto principal.

Quando se efectua a composi¸cão de duas ou mais pessoas, onde pelo menos uma foi movida da sua imagem original, então a estimativa dos pontos principais vai ser diferente, o que prova que houve modifica¸cões na imagem.

(38)

(39)

Cap´ıtulo 3

Algoritmo baseado na correla¸

c˜

ao

entre p´ıxeis

Como foi referido no cap´ıtulo anterior, existem diversas formas de modificar uma imagem com vista à altera¸cão do seu conteúdo de forma maliciosa. Uma das forma de adultera¸cão é a clonagem, isto é, copiar uma parte de uma imagem para outro lado dessa mesma imagem, para assim ocultar uma pessoa ou objecto.

Foram apresentados diversos algoritmos para a dete¸cão deste tipo de adultera¸cão, sendo um deles baseado no estudo da correla¸cão existente entre p´ıxeis. A vizinhan¸ca de um p´ıxel é o conjunto de p´ıxeis que o rodeiam. Como podemos ver na Figura 3.1, para um p´ıxel localizado nas coordenadas (x, y), uma vizinhan¸ca de 4, são os p´ıxeis que se encontram nas coordenadas (x − 1, y), (x + 1, y), (x, y − 1), e (x, y + 1), enquanto que uma vizinhan¸ca de 8 é composta pelos p´ıxeis anteriores mais os p´ıxeis (x − 1, y − 1), (x − 1, y + 1), (x + 1, y − 1) e (x + 1, y + 1).

Figura 3.1: Vizinhan¸ca de p´ıxeis

Neste cap´ıtulo vamos estudar com mais detalhe esta forma de detectar a clonagem de uma imagem, apresentado detalhes de implementa¸cão deste algoritmo, bem como resultados experimentais. A escolha para um estudo mais aprofundado recaiu sobre este algoritmo, uma vez que é baseado no estudo dos p´ıxeis, que são os elementos mais pequenos numa imagem. Foi um algoritmo pioneiro na deteçcão de altera¸cões em imagens.

(40)

3.1 Conceitos b´

asicos

Antes de apresentar o algoritmo implementado, vamos apresentar alguns conceitos essen-ciais `a sua compreens˜ao.

Durante a descri¸cão do algoritmo, vamos-nos referir à DCT (Transformada discreta do coseno), que serve para expressar um sequência de pontos finita em termos da soma de fun¸cões coseno oscilando a diferentes frequências, isto para reduzir a informa¸cão existente nos componentes de maior frequência. A expressão da DCT para um vector de uma dimensão com N elementos é

Y = C(N )_{· X, onde C}_jk(N )= r αj N cos Π(2k + 1)j 2N , e α0= 1, αj = 2 para j > 0.

Quantiza¸cão, conceito utilizado na descri¸cão do algoritmo, refere-se à transforma¸cão de um conjunto cont´ınuo de valores, num conjunto de valores mais pequenos. A aplica¸cão da DCT seguida da quantiza¸cão serve para uma representa¸cão mais robusta da informa¸cão da imagem. Um exemplo da aplica¸cão da DCT e quantiza¸cão a uma matriz, está representado na Figura 3.2.

Figura 3.2: Aplica¸c˜ao da DCT e quantiza¸c˜ao a uma matriz com os valores dos p´ıxeis de uma imagem.

3.2 Algoritmo

O algoritmo apresentado baseia-se na análise da correla¸cão existente entre pixeis vizinhos e na tentativa de dete¸cão de altera¸cões dessa correla¸cão. Este algoritmo tem como objetivo descobrir as partes da imagem que foram copiadas de um lado e colocadas noutro lugar difer-ente e marcar na imagem a fonte e o destino da parte clonada (Figura 3.3).

O algoritmo tem como parâmetros de entrada uma imagem a cores (RGB), na qual se pretende encontrar altera¸cões, o tamanho do bloco pretendido, um coeficiente de quantiza¸cão (no caso de utilizarmos a DCT) e um valor de decisão, que é o número de partes iguais que pretendemos encontrar. Na Figura 3.4 vemos o diagrama do algoritmo.

(41)

Figura 3.3: Parte de uma imagem copiada de um lado para o outro [3].

(42)

Come¸ca-se por passar a imagem para a escala de cinzentos. Como é uma imagem RGB, us´_{amos a fórmula Y = 0.299 ∗ R + 0.587 ∗ G + 0.114 ∗ B. A razão pela qual se usou a} imagem na escala de cinzentos, foi para facilitar a cria¸cão dos blocos e para facilitar também a compara¸cão desses mesmos blocos. Numa imagem a cores, existiriam duas formas poss´ıveis de aplicar o algoritmo: a primeira, consistia em processar os planos de cor separadamente e obter três resultados de duplica¸cão. A outra, era cada p´ıxel nos blocos ser composto por cada um dos valores de cada plano de cor [5].

De seguida parte-se a imagem em blocos, de acordo com o parˆametro especificado. Para divir a imagem em blocos, percorremos a imagem toda, a partir do canto superior esquerdo para a direita e para baixo at´e ao canto inferior direito, deslizando os blocos p´ıxel a p´ıxel, obtendo-se (M − B + 1)(N − B + 1) blocos, isto para uma imagem de M × N p´ıxeis e blocos de tamanho B × B.

A partir daqui existem dois modos de funcionamento, um em que é usado o cálculo da DCT e outro em que não se efectua essa transforma¸cão.

Na primeira forma de funcionamento, depois de se ter a imagem em blocos, calcula-se a DCT dos valores dos blocos e quantizam-se esses valores. Na aplica¸cão da quantiza¸cão, os blocos com os valores vindos da aplica¸cão da DCT, são multiplicados pelo coeficiente de quantiza¸cão, em seguida divide-se cada elemento do bloco pelo valor correspondente na matriz de quantiza¸cão e por fim arredonda-se o valor obtido para o inteiro mais próximo. A quantiza¸cão é feita com uma tabela de quantiza¸cão JPEG (Tabela 3.1), isto se for usado um tamanho do bloco de 8. Se for usado um tamanho de 16, usamos

Q16= Q′ 8 2.5Q18I 2Q81I 2.5Q88I , onde Q′ 8 =     2Q11 2.5Q12 . . . 2.5Q18 2.5Q21 2.5Q22 . . . 2.5Q28 . . . . 2.5Q81 2.5Q82 . . . 2.5Q88    

No outro modo de funcionamento, s˜ao utilizados os valores originais dos p´ıxeis.

Em seguida os blocos obtidos anteriormente são colocados numa matriz, onde cada linha é um bloco. Como cada linha da matriz é um vector, o bloco tem de ser passado para vector. No caso de se ter calculado a DCT, o bloco vai ser percorrido em zig-zag (Figura 3.5) para se passar para vector, caso contrário vai ser percorrido em raster scan (Figura 3.5). Isto deve-se ao facto de com a DCT a diagonal superior da matriz com o resultados ficar com os valores mais importante.

(43)

A matriz é então ordenada lexicograficamente, e depois verificam-se cada duas linhas con-secutivas. Se forem iguais, guardam-se as coordenadas desse blocos (as coordenadas do p´ıxel superior esquerdo), calcula-se o deslocamento entre os dois blocos (Figura 3.6) e incrementa-se um contador associado a esse deslocamento. Por exemplo, sendo (x1, y1) e (x2, y2) as coor-denadas de dois blocos iguais, o deslocamento entre os dois, (s1, s2) = (x1− x2, y1− y2), e o contador desse deslocamento, C(s1, s2) = C(s1, s2) + 1. Os deslocamentos são normalizados, para serem sempre maiores que zero. No final o contador C vai indicar a frequência com que cada deslocamento ocorre. Enquanto estamos a calcular os delocamentos, descartamos os blocos sobrepostos (blocos que coincidem em parte com outros blocos), para reduzir o número de blocos iguais e obter melhores resultados. Os blocos entre os quais existe(m) o(s) deslocamento(s) que ocorreram mais vezes são marcados na imagem. O algoritmo tem como resultado uma imagem com a zona clonada marcada da mesma forma, onde foi copiada e onde foi colocada.

Figura 3.6: Mesmo vector deslocamento [3].

16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 Tabela 3.1: Q: tabela de quantiza¸c˜ao JPEG.

3.3 Resultados experimentais

Para efectuar os testes ao algoritmo foram utilizadas 23 imagens a cores obtidas em ftp://ftp.ieeta.pt/~ap/images/kodak/768x512/256/, com o tamanho 768 × 512 p´ıxeis. As imagens foram alteradas com o programa de edi¸c˜ao GIMP [1], copiando uma parte da imagem e colando-a noutra parte da mesma imagem. Nas imagens foram copiadas e coladas

(44)

entre uma e seis partes. Testámos as duas versões do algoritmo em todas as imagens, e colocaram-se os resultados na Tabela 3.2, onde estão os resultados da versão do algoritmo baseado na DCT, e na Tabela 3.3, que contém os resultados da versão do algoritmo baseado nos valores originais dos p´ıxeis da imagem. As tabelas de resultados têm 4 colunas: a coluna ”I”, contém a referência à imagem que foi testada; ”Altera¸cões”, é o número de peda¸cos da imagem que foram copiados e colados noutro lado; ”Deteçcões”, é o número de partes iguais que o algoritmo detectou; ”Acertos”, é o número de partes semelhantes em que o algoritmo acertou.

I Altera¸cões Deteçcões Acertos

3.7 1 1 1 3.8 1 1 1 3.9 1 1 1 3.10 1 1 1 3.11 1 1 1 3.12 1 1 1 3.13 1 1 1 3.14 2 2 2 3.15 2 2 2 3.16 2 2 2 3.17 2 2 2 3.18 3 3 3 3.19 3 3 3 3.20 3 3 3 3.21 3 3 3 3.22 3 3 3 3.23 4 4 4 3.24 6 6 6

Tabela 3.2: Tabela de resultados obtidos com o algoritmo baseado na DCT.

3.4 Discuss˜

ao

Os resultados obtidos com este algoritmo são bastantes interessantes, visto que se desco-briram as altera¸cões efectuadas nas imagens a maior parte das vezes, com ambas as versões dos algoritmos. Comparando ambas as versões do algoritmo, a versão da DCT é mais prop´ıcia a falsos positivos, isto é, partes da imagem que aparecem marcadas mas que não foram copi-adas de lado nenhum. Isto deve-se ao facto de em algumas imagens existirem grandes padrões constantes (por exemplo o céu).

Pelos resultados, verificámos que para um maior valor do coeficiente de quantiza¸cão, o número de blocos iguais aumenta, o que pode levar a um número maior de falsos positivos.

O algoritmo extrai os blocos directamente da imagem, fazendo com que exista um n´umero muito grande de blocos. Isto faz com que o algoritmo se torne um pouco pesado

(45)

computa-I Altera¸cões Deteçcões Acertos 3.7 1 1 1 3.8 1 1 1 3.9 1 1 1 3.10 1 1 1 3.11 1 1 1 3.12 1 1 1 3.13 1 1 1 3.14 1 2 2 3.15 2 2 2 3.16 2 2 2 3.17 2 2 2 3.18 3 3 3 3.19 3 3 3 3.20 3 3 3 3.21 3 3 3 3.22 3 3 3 3.23 4 4 4 3.24 6 6 6

Tabela 3.3: Tabela de resultados obtidos com o algoritmo baseado nos blocos originais.

cionalmente, principalmente na parte da ordena¸c˜ao lexicogr´afica.

Em seguida apresentamos algumas imagens com que testámos o algoritmo. As imagens estão apresentadas em conjuntos de três, onde a imagem da esquerda é a imagem alterada onde aplicámos o algoritmo, a imagem do meio é o resultado da aplica¸cão do algoritmo com a DCT e a imagem da direita resulta da aplica¸cão do algoritmo baseado nos valores originais dos p´ıxeis.

(46)

Figura 3.7: Imagem com uma altera¸c˜ao.

(47)

Figura 3.14: Imagem com duas altera¸c˜oes.

Figura 3.15: Imagem com duas altera¸c˜oes.

(48)

Figura 3.17: Imagem com duas altera¸c˜ao.

Figura 3.18: Imagem com trˆes altera¸c˜oes.

(49)

Figura 3.23: Imagem com quatro altera¸c˜oes.

(50)

(51)

Cap´ıtulo 4

Algoritmo baseado na correla¸

c˜

ao

entre planos bin´

arios

Com a evolu¸c˜ao que o hardware de captura e software de edi¸c˜ao de imagens teve nos ´

ultimos anos, associado ao baixo custo destas mesmas ferramentas, é cada vez mais simples alterar imagens digitais. Alterar uma imgem consiste, por exemplo, em rodá-la, redimensioná-la ou modificar o brilho da mesma. Neste cap´ıtulo vamos descrever uma forma de detectar se uma imagem sofreu algum tipo de altera¸cão do género das descritas atrás. Este algoritmo de deteçcão é baseado na correla¸cão entre os planos binários das imagens. A ideia básica assenta no princ´ıpio de que as correla¸cões entre os planos binários, assim como as caracter´ısticas de textura binária dentro dos planos binários, são diferentes entre uma imagem alterada e uma imagem original.

Um estudo mais aprofundado recaiu sobre este algoritmo, porque tal como o algoritmo de-scrito no cap´ıtulo anterior, este foi um dos primeiros algoritmos de deteçcão de transforma¸cões em imagem a surgir. Como já foi dito antes, é um algoritmo que trabalha com a quantidade mais pequena que se pode obter numa imagem, ou seja o bit.

(52)

4.1 Conceitos b´

asicos

Para melhor entender o algoritmo desenvolvido, vamos agora descrever conceitos que vão aparecer durante a sua descri¸cão. Este algoritmo é baseado no estudo dos planos binários da imagem. Na Figura 4.1, vemos uma imagem de oito bits que foi decomposta nos seus oito planos binários. Uma imagem de oito bits, é uma imagem onde o valor de cada p´ıxel é constitu´ıdo por oito bits.

Um plano binário é uma imagem onde cada ponto é um valor binário (0 ou 1). Numa imagem RGB, por exemplo, o sexto plano binário do canal verde obtém-se a partir do valor do canal verde de cada p´ıxel, considerando o sexto bit menos significativo. Na Figura. 4.2 está o exemplo de um plano binário de uma imagem. Se o valor de um p´ıxel for 234, a sua representa¸cão binária vai ser 11101010; com isto o valor binário no sexto plano é 1. Este valor na escala [0..255] corresponde a 32.

Figura 4.2: Exemplo de um plano binário de uma imagem. A imagem da esquerda é a original e a da direita é o sexto plano binário do canal verde.

Na parte da classifica¸cão dos resultados, vamos utilizar uma regressão linear múltipla. Uma regressão linear é um método utilizado para se estimar o valor esperado de uma variável, Y, a partir dos valores de outras variáveis X [23]. O modelo da regressão utilizado é dado por Y = ω0+ ωX + e. Matricialmente temos Y = ωX + e, onde

Y =      y1 y2 .. . yn      , X =      1 x11 . . . x1k 1 x21 . . . x2k .. . ... ... 1 xn1 . . . xnk      , ω=      ω1 ω2 .. . ωk      e e=      e1 e2 .. . en      .

Antes de calcular os resultados, é necessário efectuar o treino do classificador, ou seja estimar o ω. Para isso precisamos do Y para um certo conjunto X e assim determinar ω através de (matricialmente):

(53)

ω= (X′_X)−1_X′_Y.

Depois de calculado o ω, estimamos o erro e. Para isso estimamos primeiro o Ye, Ye = ωX. O erro vai ser a diferen¸ca entre o valor estimado Ye e o valor esperado Y , e = Y − Ye.

4.2 Algoritmo

Figura 4.3: Na imagem podemos ver a diferen¸ca entre o quinto e o sexto plano binário. À esquerda a imagem original e a direita a imagem alterada com 50% de rota¸cão [24].

Nesta seçcão vamos proceder à descri¸cão do algoritmo implementado. Para come¸car, é necessário passar ao algoritmo dois parâmetros de entrada, uma imagem e um ficheiro para guardar os resultados. O algoritmo come¸ca por separar a imagem que lhe é passada de acordo com os seus planos binários. Os planos usados ao longo da execu¸cão do algoritmo são o plano 5 do canal vermelho e azul e os planos 3 a 8 do canal verde. Depois de obtidos os planos binários, procedemos ao cálculo das Binary Similarity Measures, que aqui vamos chamar de caracter´ısticas. Para se obter as chamadas caracter´ısticas da imagem, come¸camos por definir as sequências de bits que representam os K p´ıxeis vizinhos, onde i passa por todos os M × N p´ıxeis da imagem xi = {xi−k|, k = 1, ..., K} e yi = {yi−k|, k = 1, ..., K}. Com K = 4 são usados quatro p´ıxeis da vizinhan¸ca, enquanto que se K = 8 são usados oito, de acordo com a Figura 4.4.

Continuando com a execu¸c˜ao do algoritmo, vamos agora calcular as agreement variables. Dado cs,r =        1 se xr = 0 e xs = 0 2 se xr = 0 e xs = 1 3 se xr = 1 e xs = 0 4 se xr = 1 e xs = 1 ,

(54)

Figura 4.4: Vizinhan¸ca entre p´ıxeis: (a) quatro vizinhos, (b) oito vizinhos.

αj_i =PK

k=1d(ci,j−k, j), j = 1...4, K = 4, onde d(m, n) =1, m = n_{0, m 6= n} .

Com base nas agreement variables anteriores s˜ao agora calculadas as accumulated agree-ments, a= _{M N}1 P iα1i, b= M N1 P iα2i, c= _{M N}1 P iα3i, d= M N1 P iα4i.

Estas quatro variáveis {a, b, c, d} são calculadas para cada plano binário da imagem e são usadas para calcular as caracter´ısticas m1 a m9, de acordo com a Tabela 4.4, usadas para efectuar a identifica¸cão de altera¸cões na imagem.

Em seguida vamos calcular os histogramas normalizados dos agreement scores, com base nas vari´aveis anteriores, para cada um dos planos bin´arios:

pβ_j = P iα j i P i P kαki , β = 3...8.

A partir daqui vamos calcular as caracter´ısticas dm10 a dm13, conforme a Tabela 4.4. Além das anteriores, são calculadas também as medidas de textura de Ojala [25], como vai ser descrito a seguir. Para cada imagem binária obtém-se um histograma de 256 barras baseado nos oito vizinhos ponderados de um p´ıxel. Para cada padrão de oito vizinhos a barra do histograma numerada com

n= 7 X k=0

x_i−k2i ´e incrementada numa unidade (Tabela 4.1).

Depois de calculados os histogramas de cada uma das imagens binárias, vamos normaliz´ a-los, isto é, dividimos cada valor do histograma pela soma total dos valores do histograma, para o histograma ficar representado no intervalo [0, 1] e assim ser mais fácil trabalhar os valores, ficando o histograma normalizado representado por Sb

n, n = 0...255 e b = 3...7. Com estes histogramas normalizados, obtemos as caracter´ısticas dm14 a dm16, segundo a Tabela 4.4.

(55)

1 2 4 128 xi 8 64 32 16 0 1 0 1 xi 0 0 1 1

Tabela 4.1: (a) Peso de cada um dos vizinhos do p´ıxel xi(b) De acordo com o valor dos vizinhos do p´ıxel xi, o histograma com o valor S = 2 + 16 + 32 + 128 = 178 vai ser incrementado uma unidade.

Depois de calculadas as caracter´ısticas anteriormente descritas, vamos proceder ao treino de um classificador, com o qual vamos testar se as imagens são verdadeiras ou falsas. Para o classificador foi desenvolvido um algoritmo para octave [26]. Este algoritmo tem dois modos de funcionamento, um no qual se treina o classificador e que tem como parâmetro de entrada uma matriz X, onde cada linha da matriz tem as caracter´ısticas referentes a cada imagem com as quais se treina o classificador, e um vector Y , com o resultado esperado para cada uma das imagens: −1 para imagens alteradas e 1 para imagens que não foram alteradas. O treino consiste em calcular os coeficientes de regressão, ω, e o erro, e.

Na parte de classifica¸cão das imagens, utilizamos os coeficientes de regressão e o erro, calculados na parte do treino com os quais, juntamente com a matriz de caracter´ısticas da imagem, se calcula o resultado, como já foi mostrado antes.