CATARINA
PROGRAMA DE PÓS-GRADUAÇO EM
ENGENHARIA ELÉTRICA
MARCA D'ÁGUA PARA
DOCUMENTOS VIA MODULAÇO
DE LUMINÂNCIA
Tese de Doutorado submetida à
Universidade Federal de Santa Catarina
omo requisito par ial à obtenção do grau de
Doutor em Engenharia Elétri a
MODULAÇO DE LUMINÂNCIA
Paulo Vini ius Koeri h Borges
Esta tese foi julgada adequada para a obtenção do título de Doutor em
En-genharia Elétri a, área de on entração Comuni ações e Pro essamento de Sinais,
sendoaprovadaemsua formanalpeloprogramade Pós-Graduaçãoem Engenharia
Elétri a daUniversidade Federal de SantaCatarina.
Prof. Jo eli Mayer, Ph.D.
orientador
Prof. Katia Camposde Almeida,Ph.D.
Coordenadora do CursodePós-Graduação emEngenharia Elétri a
daUniversidade Federal de Santa Catarina.
Ban a Examinadora
Prof. Jo eli Mayer, Ph.D
JoséCarlos Moreira Bermudez, Ph.D.
Vítor Heloiz Nas imento, Ph.D.
Agradeço aos professores Jo eli Mayer, José Carlos Moreira
Bermudeze Már io Holsba h Costa,peloapoio re ebidoeinfra-estrutura
on edida. Agrade imento espe ial ao professor Jo eli, pela orientação
e pelas inúmeras sugestões, fundamentais para o desenvolvimento deste
trabalho.
AgradeçotambémaosprofessoresVitorHeloizNas imento,HaeYong
Kim e Jean-Yves Tourneret pela parti ipação na ban a examinadora.
AgradeçoaindaaoProf. EbroulIzquierdo,pelaoportunidadeepeloapoio
durante o meu estágio no Reino Unido.
Agradeçotambématodosos amigose olegasdoLPDS, pelosaudável
onvívio e apoio.
Um agrade imento espe ial aos meus amigos do bairro, do surf e
da apoeira, pelaamizade e bom-humor, apesarda faltade uriosidade a
respeito do meu trabalho...
,
Agradeço a todos os meus familiares de Blumenau e do Rio de
Janeiro, em espe ial à minha tia Ângela e ao meu av Belarmino, por
fazerem parte do meu res imento.
Agradeço ainda, om extremo arinho, à minha querida esposa
An-dréia, pela sua pa iên ia, apoio, doçura e ompanheirismo, que sem
dúvida me deram ainda maismotivação para a on lusão deste trabalho.
Finalmente,gostariadeagrade eraosmeuspais,PauloSergioeHélia
Maria, e à minha irmã Beatri e, pela ajuda emo ional, arinho e
obtenção dograu de Doutor em Engenharia Elétri a.
MARCA D'ÁGUA PARA DOCUMENTOS VIA
MODULAÇO DE LUMINÂNCIA
Paulo Vini ius Koeri h Borges
Março/2008
Orientador: Jo eliMayer, Ph.D.
Área de on entração: Comuni ações ePro essamento de Sinais.
Palavras- have: pro essamento de imagens, mar asd'água.
Número de páginas: 160.
RESUMO: Este trabalho dis ute um novo método de mar as d'água hard opy
para inserir informação es ondida em do umentos. O método é hamado de
Mod-ulação em Luminân ia de Texto (TLM). O método pode inserir informação em
do umentos ompostos porqualquer tipode onteúdo, desdeque possam ser
repre-sentadosoriginalmente omodo umentos binários. Nesta abordagem,amensagemé
inseridapormeio de umamodi ação naluminân iados ara teres, sem ausarum
impa toper eptual relevante. Assim, uma modulaçãode tons de inzaéadi ionada
aotexto original. Osistemaéprojetadoparasobreviveràsoperaçõesdeimpressãoe
es aneamento,emar as visíveisnão são ne essáriaspara sin ronizaçãonadete ção,
o queé uma tarefa desaadora em mar as d'água hard opy.
No pro esso de dete ção, diversas métri as de dete ção são propostas. Após
o es aneamento dodo umento, a métri a de dete ção mais simples é a luminân ia
médiadeum ara tere. Porém,explorandoas ara terísti asdohalftonenopro esso
de impressão, é mostrado que propriedades estatísti as tais quais a variân ia, a
skewness e a kurtosis também são métri as de dete ção e ientes. Além disso, a
modulaçãode luminân ia simplesé estendida para modulação de or e de halftone,
onde diferentes matrizes de halftone são usadas na impressão, de a ordo om o
bit inserido no ara tere. As diferentes métri as são ombinadas de a ordo om
o lassi ador de Bayes, melhorando signi ativamente o desempenho do sistema.
Análisesparaadeterminaçãodataxadeerrosãoapresentadaspara adaumadessas
for the degree of Do tor in Ele tri alEngineering.
HARDCOPY WATERMARKING VIA
CHARACTER LUMINANCE MODULATION
Paulo Vini ius Koeri h Borges
Mar h/2008
Advisor: Jo eliMayer, Ph.D.
Area of on entration: Communi ations and Signal Pro essing.
Keywords: image pro essing,digital watermarking.
Number of pages: 160.
ABSTRACT: Thiswork dis ussesa newhard opy watermarkingmethodto
em-bed hidden data in o e-like do uments. The method is entitled Text Luminan e
Modulation (TLM). It an insert informationin do uments omposed by any kind
of ontent, as long as the ontent an be represented by binary text, logos, math
symbols,and even line-drawings. In this approa h,awatermarkmessage is
embed-ded by slightly modulating the luminan e of do uments hara ters while providing
lowper eptual impa t. A greylevelmodulationisaddedtothe originaltext
resem-bling a Pulse Amplitude Modulation system, where the hara ters themselves are
modulated. The system is designed to survive the print and s an operation, and
visible marks are not required to a hieve dete tion syn hronization, a hallenging
task inhard opy watermarking.
In the dete tion pro edure, several dete tion metri s are proposed. After the
do umentiss anned,the simplestdete tionmetri isthemeanluminan eofa
har-a ter. However, exploiting hara teristi s of halftoninginthe printing pro ess, it is
shown that other statisti al properties su h as the varian e, the skewness and the
kurtosis are also e ient dete tion metri s. In addition, simple luminan e
modu-lation is extended to olour modulation and halftone modulation, where dierent
halftone s reens are used for printing, a ording to the bit to be embedded in the
hara ter. The dierentmetri sare ombineda ordingtotheBayes lassier,
pro-vidingasigni antlybetterperforman ethanusingthemetri sseparately. Analyses
to determine the bit error rate are presented for ea h of the metri s, onsidering a
1 INTRODUÇO 1
2 APLICAÇÕES E PROPRIEDADES 6
2.1 Apli ações . . . 6
2.1.1 Proteção de Direitos Autorais . . . 6
2.1.2 Fingerprinting . . . 7
2.1.3 Proteção Contra Cópias Ilegais . . . 7
2.1.4 Monitoramentode Transmissões . . . 8 2.1.5 Autenti açãode Conteúdo . . . 8 2.1.6 Indexação de Dados. . . 9 2.2 Propriedades . . . 9 2.2.1 Fidelidade . . . 10 2.2.2 Capa idade . . . 10 2.2.3 Robustez. . . 11 2.2.4 Segurança . . . 11
2.2.5 Dete ção Cega eNão-Cega . . . 12
2.3 Con lusões. . . 12
3 TÉCNICAS EXISTENTES 13 3.1 Métodos Clássi os. . . 13
3.1.1 MétodoBási o porCorrelação . . . 13
3.1.2 Mar as D'Água viaSS-CDMA . . . 16
3.1.3 Mar a D'Água viaQIM . . . 17
3.1.4 Bits Menos Signi ativos . . . 18
3.2 EfeitosdaImpressão e doEs aneamento . . . 19
3.2.1 Cara terísti as dos Dispositivos . . . 20
3.2.2 OPro esso de Halftoning . . . 22
3.3 Mar as d'Água Hard opy . . . 23
3.3.1 Mar a d'Água para Imagens . . . 23
3.3.2 Mar as D'Água para Texto . . . 25
3.4 Con lusões. . . 28
4 CANAL DE IMPRESSO E ESCANEAMENTO PROPOSTO 29 4.1 Modelo de Canalde Impressãoe Es aneamento Proposto . . . 29
4.1.1 Distorçõesnos Valores de Pixel . . . 30
4.1.2 Modi açõesPropostas . . . 30
4.2.1 Variân iaAmostral . . . 35 4.2.2 Skewness Amostral . . . 35 4.2.3 Curtose Amostral . . . 36 4.2.4 Comentários sobre
σ
2
b
,γ
1b
eγ
2b
. . . 37 4.3 Con lusões. . . 41 5 MÉTODO PROPOSTO - TLM 42 5.1 SoluçãoProposta . . . 42 5.1.1 Inserção Genéri a . . . 445.1.2 Limite Superior para Capa idade . . . 44
5.1.3 Implementação Práti a . . . 47
5.1.4 Limiarização. . . 48
5.2 Con lusões. . . 49
6 MÉTRICAS PARA DETECÇO 51 6.1 Suposições Estatísti as para asDistorções . . . 52
6.2 Métri as de Dete ção Estatísti as . . . 53
6.2.1 Dete ção pelaMédia Amostral. . . 53
6.2.2 Dete ção pelaVariân iaAmostral . . . 55
6.3 Dete ção Usando Momentos Estatísti os de Ordem Elevada. . . 58
6.3.1 Skewness Amostral . . . 58
6.3.2 Curtose Amostral . . . 59
6.4 Dete ção Espe tral . . . 59
6.5 Combinando Diferentes Métri as. . . 62
6.6 Con lusões. . . 63
7 OUTRAS APLICAÇÕES 64 7.1 Códigos de Barra 2-DMulti-Nível . . . 64
7.2 Proto olo Práti o para Autenti ação de Do umentos . . . 65
7.2.1 Codi ação . . . 66
7.2.2 De odi ação . . . 67
7.2.3 Ambiente om Ruído . . . 69
7.3 Codi ação baseada em Posição . . . 70
7.3.1 Modulação Seqüen ial . . . 71
7.3.2 Codi ação Posi ional . . . 71
7.3.3 Distorção de PBC Versus SM . . . 72
7.3.4 Dete ção . . . 73
7.4 Segmentação de Do umentos em ImagensRuidosas . . . 76
7.5 Con lusões. . . 78
8 O USO DA COR 79 8.1 Motivação para oUso daCor . . . 80
8.2 Comentários sobre ImpressãoColorida . . . 80
8.2.1 Modelo Analíti o para o CanalPS Colorido . . . 81
8.3 OPro esso de Dete ção . . . 82
8.3.1 Métri a de Dete ção . . . 83
8.5 Métri a Auxiliarpara Melhor Desempenho naDete ção . . . 90
8.6 Con lusões. . . 91
9 EXPERIMENTOS 92 9.1 Parâmetros de Ruído eDistorção . . . 93
9.2 Experimento 1. . . 94
9.3 Experimento 2- TLM 1 . . . 97
9.4 Experimento 3- TLM 2 . . . 105
9.5 Experimento 4- TLM 3 . . . 107
9.6 Experimento 5- Dete ção Espe tral . . . 107
9.6.1 HalftoneTipo RuídoAzul . . . 107
9.6.2 HalftoneTipo RuídoVerde . . . 108
9.6.3 Taxa de Erro para Dete ção Espe tral . . . 110
9.7 Experimento 6- Códigos de Barra2-D Multi-nível. . . 111
9.8 Experimento 7- Proto olo de Autenti ação. . . 112
9.8.1 Carteirade Identi ação . . . 112 9.8.2 Taxa de Erro . . . 113 9.9 Experimento 8- PBC . . . 114 9.9.1 PBC . . . 114 9.9.2 Taxa de Erro . . . 115 9.9.3 PBC Vs. SM . . . 116 9.10 Experimento 9: Usando TCM . . . 116
9.10.1 Modulação doCanal Azul . . . 116
9.10.2 Modulação noCanal Vermelho. . . 117
9.10.3 Modulação Combinada . . . 118
9.10.4 Dete ção Auxiliarpor Ângulo . . . 119
9.10.5 Ganho de ModulaçãoVariável . . . 119
9.11 Con lusões. . . 121
10 CONCLUSÕES 122 10.1 Resultados Prin ipais . . . 123
10.2 TrabalhoFuturo. . . 125
A Variân ia da Variân ia Amostral 127 A.1 Média . . . 127
A.2 Variân ia . . . 128
A.3 Valor Médio Quadráti o . . . 128
B Momento de Ter eira Ordem 130 C Momento de Quarta Ordem 132 D Valor Esperado e Variân ia da Potên ia Média Amostral 133 D.1 Valor Esperado . . . 133
F Análise PBC-2 147
2.1 Exemplo de omo uma imagem pode ser manipulada sem que seja
ompletamente orrompida. . . 7
2.2 Exemplo de omo uma imagemdigital pode ser manipulada. . . 9
3.1 Diagrama ilustrandoa inserção nodomínioespa ial. . . 14
3.2 Valor da orrelação para sementes diferentes. A posição 13 orres-ponde à orrelaçãofeita om a semente orreta. . . 15
3.3 Diagrama ilustrandomultiplexaçãopordivisão de espaço.. . . 16
3.4 IlustraçãosimplesdoQIM.Ospontos identi adospor
◦
'se△
's or-respondem a dois quantizadores diferentes. Seb = 1
, o sinal originalc
h
é quantizado para o◦
mais próximo. Seb = 0
, O sinal original é quantizado parao△
mais próximo. . . 183.5 Imagem de omposta em planos de bits. . . 19
3.6 Resumodo pro esso de es aneamento. . . 21
3.7 Diagrama ilustrando a operação de binarização pixel-a-pixel usada em ordered dithering. . . 23
3.8 Ilustraçãodeline-shift oding. Alinha entralnoparágrafosuperioré ligeiramentemovidapara ima. Noparágrafoinferior,odeslo amento é visível por meio da superposição da imagem original e da imagem mar ada. . . 26
3.9 Exemplo de word-shift oding. Na frase superior, as palavras sure, fortune, seek e you, foram levemente deslo adas. Na frase inferior, o deslo amentoé visível devido a superposição om a imagemoriginal. 26 3.10 Exemplo de hara ter-shift oding. . . 26
3.11 Ilustraçãodedois pixels entrais emumavizinhança
3
× 3
queteriam diferentes ipping s ores. . . 284.1 GUI dos es aners Genius HR6XSlime HP 2300C. . . 33
4.2 Ilustraçãodoefeitodeuma urtoseeumaskewnesspositivasenegativas. 35 4.3 Distribuiçãouniforme
p
D
assumida para os oe ientes da matrizde halftone. . . 374.4 Distribuiçãoof
b
. . . 384.5 Distribuiçãodo ruído
η
2
. . . 384.6 Efeitoda variân iadependente daluminân ia de entrada. . . 39
4.7 Ilustraçãode blo os de halftone. . . 39
5.1 Exemplos de do umentos dis utidos neste trabalho. . . 43
5.2 Ilustração de
a
2
+ 1
níveis distintos no pro esso de halftoning, paraa = 2
. . . 455.3 Limite superior nataxade transmissão atingível. . . 46
5.4 . . . 46
5.5 . . . 47
5.6 Modulação naluminân ia om um ganho muito alto. . . 48
5.7 Exemplo de texto es aneado em 300 ppi. . . 49
5.8 Efeitovisual davariação dolimiarde segmentação do texto. . . 50
6.1 Aárea sombreada(
x
a+
∞
)representaa probabilidadede erro dada por erf (x
). . . 556.2 Típi adistribuição dadete ção baseada naluminân ia média. . . 56
6.3 Típi adistribuição dadete ção baseada navariân ia. . . 56
6.4 Ilustraçãoexagerada de diferentes padrõesde halftone. . . 60
7.1 Ilustraçãodo ódigos de barra 2-D. . . 64
7.2 Diagramadoblo odeen riptação. Oblo o`s/b'representa onversão string de texto para representação binária. O blo o `
M
' representa um mapeamentodec
′
b
a partirde|c
b
|
bitsparaK
bits. Osímbolo representa a operaçãoXOR. . . 677.3 Extraindo
ˆc
ew
ˆ
dodo umento re ebido. . . 687.4 Diagrama de blo os da de odi ação. O blo o `s/b' representa a onversãostringparabinário. Oblo o`
M
'representaomapeamento deˆc
′
b
om|c
b
|
bits paraK
bits. O símbolo representa a operação XOR. . . 687.5 Capa idadedo PBC em função de
K
e da distorçãoD
. . . 737.6 Capa idadeem função dadistorção
D
, paraK = 200
. . . 747.7 Razão
R
P
/R
S
, em função dadistorçãoD
. . . 747.8 Razão
R
P
/R
S
, em função dadistorçãoD
,paraK = 100
. . . 748.1 Exemplo de um padrão de teste para halftoning, ilustrando os ol-orantes C, M, Y e K. . . 82
8.2 Exemplo de um histograma de três anais para um ara tere modu-ladoapenasno analazul. Oeixohorizontalrepresentaaintensidade da or (entre preto ebran o). . . 83
8.3 Exemplodeumhistogramadetrês anaisparaum ara termodulado apenasno analvermelho. Oeixohorizontalrepresentaaintensidade da or (entre preto ebran o). . . 83
8.4 Limitesuperior de Bhatta haryya naprobabilidadede erro usandoo lassi ador de Bayes, em função damodulação nos anais vermelho eazul. . . 88
8.5 Impa to per eptual baseado noespa o de or CIELAB ausado pela modulação da or do ara tere, em função da modulaçãonos anais vermelho e azul. . . 89
8.6 Ilustração dadistorção em função de
w
B
andw
R
, onsiderando uma probabilidadede erroP
e
= 0.0001
.. . . 908.7 Padrões de halftone ltrados ltro dete tor de bordas dire ional de
−45
◦
.. . . 91
9.1 Comparação entre um ara tere impresso e es aneado e um ara -tere distor ido om o modelo PSproposto. . . 94
9.2 Blo os om luminân iasvariandode 0 a 1. . . 95
9.3 O efeito da variân ia dependente da luminân ia de entrada, depois doPS. . . 96
9.4 Oefeitode skewnessdependentedaluminân iade entrada,depoisdo PS. . . 96
9.5 O efeito de urtose dependente daluminân ia de entrada, depois do PS. . . 96
9.6 Histogramas om diferentesformatos ilustrandoamudan aem skew-ness e em urtose de uma região PS, de a ordo om a luminân iade entrada
s
0
. . . 979.7 Exemplo de texto segmentado, representado em es ala negativa para visualização. As áreas om zoom ilustram a maior variân ia dos a-ra teres modulados. . . 98
9.8 Usando apenas a médiaamostral omo métri a de dete ção. . . 100
9.9 Usando apenas a variân iaamostral omo métri a de dete ção. . . 100
9.10 Usando apenas skewness amostral omo métri a de dete ção. . . 100
9.11 Usando apenas a urtoseamostral omo métri a de dete ção. . . 101
9.12 Limiares de de isão usando as métri as de dete ção separadamente, representadas naes ala 0-255. . . 101
9.13 Limiaresde de isão ombinandoduasmétri asdedete ção, represen-tada naes ala 0-255. . . 101
9.14 Espaço 3-D om superfí ie de de isão separando as duas lasses, usandoa média, avariân ia e skewness omométri as de dete ção. . 102
9.15 ROC orrespondenteà dete ção pelamédiaamostral. . . 102
9.16 ROC orrespondenteà dete ção pelavariân iaamostral. . . 103
9.17 Probabilidade de erro para diferentes ganhos, usando
d
M
omo métri ade dete ção. . . 1069.18 Probabilidadedeerroparadiferentesganhos,usando
d
V
omométri a de dete ção. . . 1069.19 Histogramadabanda baixa omo métri ade dete ção. . . 108
9.20 Histogramadabanda alta omo métri ade dete ção. . . 109
9.21 Ilustraçãodas bandasbaixae altapara o ruído azul. . . 109
9.22 Grá o3-D ilustrando as bandasbaixa, médiae alta. . . 109
9.23 Distribuiçãode luminân ia média dos ara teres. . . 110
9.24 Probabilidade de erro para diferentes ganhos, usando halftone tipo ruído azul everde para modular os ara teres. . . 111
9.25 Auenti ação de do umentos usando o proto olo proposto na Seção 7.2. Notea luminân ia dos ara teres modi ados. . . 113
9.26 Do umentode identi açãoes aneado. O último dígito dadata de validadeé modi adode 8para 9, omo indi adopela e ha. . . 113
9.27 Taxasde Erro de Dete çãousandoodete tor de orrelaçãono proto- olo de autenti ação. . . 114
9.29 Comparaçãoentre as distorçõesem PBC e em SM omo uma função
donúmerodebitsinserido,paraumdo umento ompostode
K = 200
ara teres. . . 1169.30 Histogramadamétri a de dete ção
d
B
, para o anal azul. . . 117 9.31 Histogramadamétri a de dete çãod
R
, para o anal vermelho. . . 118 9.32 S atter plot ilustrando a urva separando os pontos orrespondentesaobit1 e aobit0. . . 119
9.33 Plot ilustrando a superfí ie separando os valores de dete ção para o
bit1 ebit 0,usando
d
b
,d
r
ed
a
omo métri ade dete ção. . . 120 9.34 Probabilidade de erro para diferentes ganhos, usandow
B
= w
R
=
0.97, 0.9, 0.84
. O eixo horizontal indi a a diferença de luminân ia entre o ara tere original e o modulado, para os anais vermelho eazul. Alinha heiarepresentaataxadeerroteóri aderivadanaSeção
8.3, e os pontos em ruz representam as taxas de erro experimental
depois doPS. . . 121
F.1 Figurailustrando a inequaçãoem F.8. . . 148
F.2 Figurailustrando o sistemade oordenadas
(u
′
, v
′
)
,baseado em uma
9.1 Impressoras e es aners usados nos experimentos. . . 93
9.2 Taxasdeerroexperimentaltestando30360 ara teres. Alegendapara osdispositivos édada na Tabela9.1. . . 104
9.3 Taxa de erro experimental testando 30360 ara teres e ombinando as métri as de dete ção de a ordo om o lassi ador de Bayes. A legendapara os dispositivosé dada naTabela 9.1. . . 104
9.4 Taxa de Erro Experimentalpara THM e TLM. . . 110
9.5 Taxas de Erro Experimentalpara ódigo de barras 2-D. . . 112
9.6 Taxas de erro experimentais. . . 115
Symbols
b
Imagem halftoned.b
Mensagem inseridaem um sinal original.b
i
Elementobinário damensagemb
.b
l
Elementos damensagemb
.b(m, n)
Elementom, n
daimagemb
.b
0
Imagem representando um blo ode halftone.c
h
Vetor genéri o representando um sinal original(vídeo, áudio, imagem,et ).c
Imagem original.C
Capa idadedeumsistemademar ad'água,expressaembits.d
Métri a de dete ção baseada na ombinação de diferentes métri asd
i
.d
Estatísti a de dete ção baseada em orrelação linear.D
H
Matriz de halftoneem algoritmosordered dithering.d
M
Métri a de dete ção baseada naluminân ia média de um a-ra tere.d
V
Métri a de dete ção baseada navariân iade um ara tere.∆
Parâmetro representando ruídono modelo de anal PS.ǫ
Erro de distorção usando TLM.ǫ
max
Máximadistorção permitida.ε
max
Função de inserção em TLM.ϕ
2
Parâmetrodo analPSusadopara representar avariân iado ruído ausado pelohalftone.G
w
Ganho em mar a d'águabaseadas em orrelação.γ
1
Skewness.γ
2
Curtose.J
Tamanho dalateral de uma matriz de halftone.K
Número de elementos em um do umentode texto.κ
w
Chave para geração de seqüên ia pseudo-aleatória.L
0
Comprimentodamensagem de mar ad'água, em bits.L
Número de níveis de quantização -1 representando uma imagem digital.λ
Limiar para a dete ção damar a d'água.Λ
Maiorvalornaes ala de representação de uma imagem.M
Conjuntodeíndi esrepresentandodiferentesmensagensemmar as d'água QIM.n
c
Vetor representando um ruído genéri o.N
Número de pixels em uma imagemou ara tere.η
1
Parâmetro representando ruídono modelo de anal PS.η
2
Parâmetro representando ruídono modelo de anal PS.η
3
Parâmetro representando ruídono modelo de anal PS.ω
i
Elementos deΩ
.Ω
Conjunto ontendoospossíveisvaloresdemodulaçãousandoTLM.Q
Conjuntode quantizadores em mar as d'águaQIM.Q
H
Quantizadorusado pelo algoritmode halftone.r
p
Resolução de impressão.r
s
Resolução de es aneamento.s
Imagem digital anterior àimpressão ou aohalftone.s
w
Vetor mar adogenéri o (vídeo,áudio, imagem,et ).s
′
w
Sinal possivelmentemar ado (vídeo, áudio,imagem, et ).s(m, n)
Imagem mar adavia TLM.S
CardinalidadedeΩ
.T
Limiar para segmentação de texto dofundo.w
r
Vetor de mar a d'água genéri o (vídeo, áudio, imagem,et ).W
Conjuntode padrões de mar a d'águaw
i
em CDMA.w
i
Elemento de um vetor de mar ad'água.w
m
Sinal de mar a d'água CDMA formada porL
vetoresw
ri
.w(m, n)
Função de modulação para mar arum ara tere via TLM.y
n
Sinal mar adogenéri o quesofreu ataques.y
′
n
Sinal om ataques possivelmentemar ado.Abreviações
AWGN Additive White GaussianNoise.
CCD Charge Coupled Devi e.
CDMA Code DivisionMultiple A ess.
DCT Dis rete CosineTransform.
DFT Dis rete FourierTransform.
dpi Dots PerIn h.
FFT Fast Fourier Transform.
DWT Dis rete Wavelet Transform.
HVS Human Vision System.
i.i.d. Independent and Identi allyDistributed.
ISI Intersymbol Interferen e.
TLM TextLuminan e Modulation.
THM TextHalftone Modulation.
LPM Log-PolarMapping.
LSB Least Signi ant Bit.
OCR Opti al Chara ter Re ognition.
PAM Pulse AmplitudeModulation.
PCM Pulse Code Modulation.
ppi Pixels Per In h.
PRS Pseudorandom Sequen e.
PS Print and S an.
QIM QuantizationIndex Modulation.
INTRODUÇO
Nas últimasdé adas aso iedadetem observado a onversão de sinais omo
ima-gens, áudio e vídeo do formato analógi o para uma representação digital. Dados
digitais apresentam inúmeras vantagens em omparação om a sua orrespondente
versãoanalógi a, umavez quearepresentaçãodigitalmelhoraaa essibilidade,
por-tabilidadeee iên iadatransmissãodainformação. Noentanto, omo res imento
daInterneteosavançosdedispositivosde ópiataisquaisgravadoresdeCDeDVD,
a dupli ação e a disseminação ilegal de onteúdo protegido por direitos autorais
tornaram-se extremamente fá eis. Visando prover proteção ontra ópias ilegais e
proteção de direitos autorais, duas té ni as omplementares foram desenvolvidas:
mar as d'águadigitais e riptograa.
Métodos riptográ os não negam a presença da informação es ondida, mas a
fazem ilegível ou ininteligível por meio de diversas transformações [1℄. Apesar do
fatoquea riptograaéefetivamenteusadaparaproteger mensagensduranteo
pro- essode transmissão,apósaetapade re epção ede riptograadamensagem,estaé
idênti aàoriginalenãoestámaisprotegida. Dessaforma,nesseestágioéimpossível
garantirque essa mensagem desprotegida não será ilegalmentedisseminada ou
mo-di ada. Nesse ontexto,mar asd'águadigitaispodem omplementara riptograa
através da inserção de um sinal es ondido diretamente no sinal original, de forma
que esse sinal adi ionalesteja idealmentesemprepresente.
O ampode estudodemar asd'águaérelativamentenovoebastantepromissor,
tendo ganhado força na dé ada de 1990. Diversas apli ações omer ias já estão
disponíveis, tais quais os sistemas de segurança desenvolvidos pela Digimar [2℄ e
AlpVision [3℄, que fazem uso de mar as d'água em seus produtos. Sistemas de
distribuição gratuita também pode ser en ontrados na Internet, omo o sistema
SAMD [4℄, porexemplo.
in-ou vídeo. A té ni a utilizadano pro esso de inserçãonão deveria ausar alterações
visíveis. De a ordo om a literatura tradi ional, o onteúdo digital que re ebe a
mar a d'água será denominado ` onteúdo original' neste trabalho. Adi ionalmente,
o termo mar a d'água será utilizado de forma relativamente ampla, podendo
sig-ni aramensagemaser inserida,osinalaser inserido,ouamodi açãofeitasobre
o sinal original.
Um grandenúmerode modi açõesem diversos domíniospodemser usadasem
té ni as de mar a d'água. Antes dainserçãodamar ad'água, osinal originalpode
ser transformado para outro domínio através da transformada dis reta de Fourier
(DFT) [7, 8℄, transformadas wavelets (DWT) [9, 10℄, ou transformada dis reta do
oseno (DCT) [11, 12, 13℄. Algumas das modi açõespossíveisnesses domíniossão
adiçãode ruído, reordenaçãode oe ientes, remoçãode oe ientes, dentre outras.
Além disso, onsiderando o sistema visual humano (HVS) e/ou modelos auditivos,
os efeitos per eptuais das modi ações sobre o sinal original podem ser reduzidas
signi ativamente.
Assim omo os trabalhos men ionadosa ima, a maioriados métodos propostos
naliteraturasãosistemasdemar ad'águaparaimagens,seguidosporvídeoeáudio.
Uma importante ategoria de mídia, não tão freqüentemente estudada, é aquela de
do umentos tipo texto. Enquanto em imagens naturais existe uma ri a es ala de
tonsde inzaoumesmo oresadequadosparamodi ações,emdo umentosdetexto
normalmente não se pode bene iar de um sinal original tão diverso. O problema
torna-seainda mais desaadorquando se onsidera que odo umento mar adodeve
ser impresso e manter-se mar ado. Neste enário, a dete ção da mar a d'água
em do umentos impressos normalmente se dá om o auxílio de um es aner para
digitalizaro do umentoe identi ara possível mar a.
Umnúmeromoderadodetrabalhosfo adosemmar asd'águadigitais apazesde
sobreviverao pro essode impressão ees aneamento (print and s an- PS) podem
ser en ontradosnaliteratura. Essesmétodos são hamadosde hard opy
watermark-ing,dea ordo omaliteraturainglesa. Cadaumdessesmétodosédesenvolvidopara
um determinado tipo de onteúdo, omo imagens oloridas ouem tons de inza. O
método apresentado nesta tese é espe í o para do umentos de texto, já que esses
possuem ara terísti as distintas que não permitem a apli ação direta de métodos
hard opy watermarking para imagens.
Este estudo é motivado pelo fato de que o armazenamento e a tro a de
do u-mentos ominformaçãosensívelou onden ialfazempartedodia-a-diadequalquer
so iedade. Suponha que uma instituição talqual um artório, um ban o, a polí ia,
nas imento, es rituras, relatórios onden iais, petições, de larações, entre outros.
Freqüentemente, essas importantes ópiasem papelsão tro adasentre pessoas e/ou
instituições. O desao está em desenvolver um método onável para a
autenti a-ção de do umentos tipohard opy, de formaque a informação ontida nessas ópias
possam ser assumidas o iais, originadas de fontes seguras e sem qualquer tipo de
alteração mali iosa.
Métodos tradi ionais de autenti ação de do umentos em papel in luem ódigos
de barra, selos plásti os e holográ os, mar as d'água físi as sobre o papel e
assi-naturasde pessoas autorizadas. Noentanto,modi açõesnotexto podemser feitas
de maneira imper eptível, alterando o sentido de frases ou mesmo do do umento
inteiro. Do umentos om ódigos de barra, por exemplo, podem ser es aneados,
modi ados e re-impressos, e o ódigo de barra mantém-se o mesmo. Assinaturas
manuaissemprepodemser falsi adas,assim omoselos espe iais. Adi ionalmente,
todas essasestratégias ausamum impa toindesejávelnodo umentooriginal,oque
é um aspe to freqüentemente indesejado.
Nesta tese, um método é proposto para inserir de forma efetiva informação
es- ondida em um do umento. A informaçãolateral pode servir omo uma mar a de
autenti açãoousimplesmente omoumamensagemadi ional. Ométodoé hamado
de modulaçãode luminân ia em texto,ou textluminan e modulation (TLM).
Sabe-se que a maior parte dos do umentos do tipo es ritório são ompostos de texto
preto sobre um fundo bran o, sendo hamados de do umentos binários. Usando a
soluçãoproposta, épossível inserirere uperar informaçãoemdo umentos
ompos-tos porqualquer tipode onteúdo omotexto,logos,desenhos esímbolos,desdeque
estes possam ser representados de forma binária (i.e., preto e bran o). TLM
per-mite atransmissãodainformaçãopermitindotonsde inza emtexto tradi ional,ao
mesmo tempo que mantém um baixoimpa to per eptual. Uma modulaçãode tons
de inza é adi ionada ao texto original, de forma análoga a um sistema tipo pulse
amplitude modulation (PAM). Apesar de queessas modi açõesna luminân ia não
alteram a qualidade de texto per ebida, elas podem ser fa ilmente dete tadas por
um es aner, epodemser de odi adas para a re uperaçãoda mensageminserida.
É importanteobservarqueum métodosimilarpara autenti açãode do umentos
foi desenvolvidoparalelamenteede formaindependente pelo ComputerVision and
Multimedia Laboratory na Universidade de Genebra. Os seus prin ipais resultados
são apresentados em[14,15℄,entreoutros. Noentanto,apesar dequeapesquisa
de-senvolvidanaSuíçaeapesquisaapresentadanestatesesãobaseadasnamesmaidéia
fundamental de modular a luminân ia dos ara teres, elas seguem fo os diferentes.
e inéditas. Umabreve des rição desses apítulos édada a seguir.
Esta tese é organizada da seguinte maneira. Este apítulo dis utiu de maneira
breve o ampo de mar as d'águadigitais e apresentou alguns aspe tospráti os que
motivamoestudo de métodos tipo hard opy watermarking. Alémdisso, uma visão
geral dasolução proposta foi apresentada.
OCapítulo2dis utealgumasdas maisimportantes apli açõesdemar asd'água
digitaispara diferentes tiposde mídia. Esse apítulotambém omentaalgumasdas
prin ipaispropriedadesde sistemasdemar ad'água,taisquaisrobustez, delidade,
apa idade, entre outros, além dasua interdependên ia.
Umarevisão de sistemas lássi osde mar a d'águaé apresentadanoCapítulo3,
servindo omo basepara ummelhorentendimentodas ontribuiçõesdeste trabalho.
Diversos métodos são dis utidos, desde osmais bási os, omo modi ação dos bits
menos signi ativos, até os relativamente mais omplexos, tais quais modulação
do índi e de quantização (QIM) e a esso múltiplo por divisão de ódigo (CDMA).
Esse apítulo também apresenta des rições de importantes métodos desenvolvidos
espe i amente para sobreviver ao pro esso de impressão e es aneamento, tanto
em imagens quantoem texto. Osefeitos do pro esso PStambém são dis utidos.
Sob uma perspe tiva de omuni ações, o pro esso PS pode ser visto omo um
analde omuni açõesruidoso. NoCapítulo4umnovomodeloanalíti oparao anal
PSéproposto,oqualin luitodasas ara terísti asqueinuen iamodesempenhodo
sistemae aindapermiteuma tratabilidadematemáti anas análises. Umades rição
detalhada do pro esso físi o é apresentada, bus ando justi ar os modelosde ruído
adotados.
Naseqüên ia, oCapítulo5apresentaométodoproposto,dis utindopontos
rela-tivosaométodoeàsua apli açãopara segurança de do umentos e omuni ação
se- reta. Aspe tosteóri osepráti ossão abordados,assim omoproblemasde ataques
e implementação.
No Capítulo 6 diversas métri as de dete ção para determinar o bit inserido em
ada ara tere são propostas. É apresentada uma dis ussão relativa à luminân ia
média, que é a mais simples métri ade dete ção, assim omo momentos de ordens
elevadas e métri asespe trais. É mostrado que o desempenho dosistema é
aumen-tado quando essas métri as são apli adasaopro esso de dete ção.
O Capítulo 7 des reve apli ações alternativas baseadas na idéia de transmitir
informação se reta através da modulaçãodo nível de luminân ia. Espe i amente,
as ontribuiçõesapresentadasnesse apítulosão:
(i)
éindi adoqueométodode de-te çãopropostopode serestendido para ódigos de barra2-D,reduzindoasua taxaguração originalmenteproposta paraTLM, quetransmite uma mensagemse reta,
o proto olo proposto lassi a o do umento omo autênti o ou não autênti o;
(iii)
umesquemaalternativoparaTLMéproposto,que ausaumadistorçãoreduzidaaotexto mantendo a taxa de transmissão. Usando o métodode odi ação proposto,
a informaçãoé rela ionadaà posição dos ara teres modulados nodo umento.
O Capítulo 8 estende o on eito de TLM usando a or do texto omo uma
a-ra terísti a modi ável. São apresentadas uma métri a de dete ção e uma análise
determinando a taxa de erro em modulação de or em texto, ou text olour
mod-ulation (TCM), onsiderando o anal PS assumido. Além disso, um modelo de
impa toper eptual éapli ado para determinara diferençaper eptual entre um
a-ra teremoduladoenão modulado. Combinandoesse modelode impa toper eptual
e os resultados da análise de erro de dete ção, é possível determinar os valores de
modulaçãode or.
O Capítulo9apresentaresultados relativosaodesempenho dométodoproposto
neste trabalho e das apli ações propostas no Capítulo 7. O prin ipal objetivo é
ilustrar através de simulações de Monte Carlo a apli abilidade de TLM em típi os
do umentos de es ritório. Além disso, os experimentos bus am validar o modelo
de anal PSproposto no Capítulo4 e asanálises teóri as relativas àstaxas de erro
apresentadas noCapítulo 6.
Finalmente, o Capítulo 10 é dedi ado à on lusões e listade realizações.
Tam-bém, tópi os para pesquisa futura são dis utidos.
No apítulode referên ias bibliográ as, as referên ias
[100
− 109]
representam uma listadas publi ações relativas aotrabalhoapresentado nesta tese.APLICAÇÕES E PROPRIEDADES
Apesar da questão envolvendo direitos autorais e segurança ter sido a maior
propulsora da pesquisa ini ial na área de mar as d'água digitais [16℄, existem
inú-meras outras apli ações nas quais mar as d'água podem ser utilizadas. De forma
geral,sempreque forútilasso iaraum sinaloriginalqualquer informaçãoadi ional
relativa a este, essa informação pode vir a ser inserida omo uma mar a d'água.
Apesar destetrabalhoestarbasi amentefo adoemautenti açãode do umentos
im-pressos, este apítulo men iona algumas das prin ipais apli ações e vantagens que
sistemas de mar as d'água têm sobre té ni as alternativas. São omentadas
tam-bémasprin ipaispropriedades,quemuitasvezessão onitantesentresi. Deve ar
laro que ada uma das propriedades men ionadas pode estar ou não presente em
um sistema de mar a d'água bem projetado, dependendo da apli ação.
2.1 Apli ações
2.1.1 Proteção de Direitos Autorais
Para omprovar que têm direitos sobre uma dada produção, emissoras de TV
geralmente olo amoseulogotipoem umdos antosdovídeo. Emimagens,muitas
vezes pode ser en ontrado o nome do indivíduo e/ou empresa à qual a imagem
perten e. Um exemplo de omo métodos usuais fazem a omprovação de direitos
autorais e prova de propriedade seria olo ar um pequeno texto no anto de uma
imagem, omo ilustradona Figura2.1 1
.
Com freqüên ia, esse impa to visual sobre a imagem pode ser desejável, omo
uma mar a ou nome que desejam ser notados ou divulgados. No entanto,
depen-dendo da apli ação, o fato da informação extra ser per eptível ao ser humano é
onsideradaumaagressão aosinaloriginal. Convém notartambémqueessas
as estãogeralmenteemuma partenãotão signi ativadosinal, omoporexemplo
próximasdas bordas,no aso de imagens,ounoiní io de um lip,no aso de vídeo.
Assim, além do aspe to estéti o muitas vezes negativo dessa té ni a, ela permite
que se orteum pedaço do vídeo, áudio ouimagem, sem que esses se tornem
inuti-lizáveis. Caso essas mar as estivessem em uma região onde sua retiradaestragasse
o onteúdo,a própria mar ajá poderia ser vista omo uma degradação demasiada.
Para a proteção da propriedade intele tual, o dono do sinal original pode inserir
nesteumamar ad'água,representando ainformaçãodeseus direitosautorais. Essa
mar ad'águapodeeventualmente omprovarnaJustiçaqueo onteúdoem questão
lhe perten e, e quealguém infringiuseus direitosautorais [5℄.
Figura2.1: Exemplode omo umaimagempodesermanipulada sem queseja
ompletamente orrompida.
2.1.2 Fingerprinting
Paralo alizarafontede ópiasilegais,oproprietáriopodeusar até ni ade
im-pressãodigital, oungerprinting. Nesse aso,oproprietário pode inserir diferentes
mar asd'águaem ada ópiado onteúdoqueéentregueaosseusdiferentes lientes.
Fingerprinting pode ser omparado a inserir um número de série que é rela ionado
om a identi ação do omprador do onteúdo. Isso permite que o dono da
pro-priedade intele tual possa identi ar onsumidores que não umpriram o ontrato
de ompra forne endo o onteúdo em questão para ter eiros [1℄.
2.1.3 Proteção Contra Cópias Ilegais
A informação ontida em uma mar a d'água pode diretamente ontrolar
dis-positivos de gravação digitais om a nalidade de ontrolar ópias. Nesse aso, a
ser reproduzido ou não [17, 18℄. Um exemplo um pou o diferente, porém
bas-tante utilizado, é o sistema hamado Ma rovision's Video assete Anti opy Pro ess
(www.ma rovision. om) [19℄. Esse sistema é empregado em aparelhos de DVD e
vídeos assete, modi ando osinal de vídeo de formaa tentar onfundir o ontrole
automáti o de ganho em vídeos assete. Assim, o sinal original apare e perfeito
para quemo visualiza,porémuma ópia dessesinal em VHStorna-seembaralhada,
sem ondições de ser assistida. Se ada dispositivo de gravação tivesse a oplado
um dete tor de mar a d'água, esses dispositivos poderiam proibir a gravação
sem-pre queumamar a d'águarepresentando ainstruçãonão opiar fosse en ontrada.
A primeira empresa a propor tal sistema em DVD's foi a IBM, em seu entro de
pesquisa no Japão (IBM's TokyoResear h Laboratory - TRL) [20℄.
2.1.4 Monitoramento de Transmissões
EmsetratandodetransmissõesdeTV,armaouindivíduoqueanun iadeseja,é
laro,quesuapropagandasejatransmitidanohorárioe omafreqüên ia omquefoi
nego iadaepaga. Aoinserirmar asd'águaempropagandas omer iais,umsistema
automatizadode monitoramento pode veri ar se as propagandas são transmitidas
omono ontrato[21℄. Um omputadorpode monitorarastransmissõese omparar
os sinais re ebidos om aqueles de um ban o de dados de interesse. Quando um
asamento é en ontrado, a músi a, lme, ou omer ialsendo transmitido pode ser
identi ado,e onseqüentemente atalogadoo número e horáriodatransmissão.
2.1.5 Autenti ação de Conteúdo
Comoaumentodate nologiadossoftwares, adavez amaissimplesea essível
opro essodealteraçãooumodi açãodeum onteúdodigital. AFigura2.2 2
mostra
duas imagensmodi adas om um simplesprograma de pro essamentode imagens.
Em ertos asos omoprovasde rimesoudisputasjudi iais,umamodi açãodesse
tipopode setornarum problema bastantegrave. Mar asd'águafrágeis [22℄ podem
ser usadas para he ar a autenti idade do onteúdo. Uma mar a d'água espalhada
pelo sinal indi a se esse foi alterado, assim omo pode indi ar onde o orreu a
alte-ração.
O algoritmoproposto nesta tese, por exemplo, visa prover autenti ação de
on-teúdo através da inserção de informação sensível de partes do texto sobre todo o
do umento, omodis utido noCapítulo5.
(a) Imagemoriginal. (b)Imagemalterada.
Figura2.2: Exemplode omo umaimagemdigital pode sermanipulada.
2.1.6 Indexação de Dados
Outraapli açãointeressanteéaindexaçãode dadosdigitaisemgeral. Indexação
de orreiode vídeo,onde omentáriospodemserinseridosno onteúdodovídeo,
in-dexação de lmes e notí ias onde mar asd'água podem ser inseridas para lo alizar
um dado sinal pro urado por um sistema de bus a [23℄. Bibliote as digitais, ban o
de imagensemensagensde voztambém podemser atalogadasusandoessaté ni a.
A inserçãoda data e donome dopa iente em imagens médi as(de maneira
imper- eptível, é laro, para não orromper os dados originais) pode ser uma medida de
segurança bastante útil.
2.2 Propriedades
As propriedadese ara terísti as desejadas em um sistema de mar a d'água
di-gitalestão diretamenterela ionadas omasua apli ação. Dessamaneira,nãoexiste
um onjunto de requisitos que devem ser en ontrados em todas as té ni as. Por
exemplo, idealmente, no aso de proteção de direitos autorais, a informação a
tenti ação de dados, e qualquer alteração no sinal original deve ser identi ada, a
mar a d'água deve ser destruída à menor variação ou pro essamento do sinal. Ou
seja, nesse asoa mar ad'água não deve apresentar robustez alguma. Assim, serão
dis utidas aseguir asprin ipaispropriedades desejadasnas apli açõesmais omuns
men ionadas naseção anterior.
2.2.1 Fidelidade
Também referida na literatura omo transparên ia per eptual (inverso de
im-pa toper eptual)ouimper eptibilidade,adelidadedeumsistemademar ad'água
refere-se à similaridadeentre asversõesoriginal emar ada de um sinal. Cabe itar
aqui a diferença entre qualidadee delidade. Um sinal om alta delidade não
ne- essariamente tem altaqualidade. Qualidade está rela ionada ao o apelo visualou
auditivo de um sinal, isto é, se uma imagem ou som pare em bons ou agradáveis.
Sinais em que a presença ex essiva de ruído fere o sistema visual humano, HVS
(Human Vision System) [24℄ [25℄, ou o sistema auditivo humano, o HAS (Human
Auditory System) [26℄, são ditos de baixa qualidade. Por exemplo, tipi amente, o
vídeo de uma âmera de segurança está no padrão de imagem de intensidade em
tons de inza (grays ale), em baixaresolução, e omprimido,sendo geralmente
on-siderado de baixa qualidade. Se esse sinal for modi ado através de um sistema
de mar a d'água,ele ontinuará tendo baixaqualidade, mas seo sinal mar ado for
bastante similarao original,será onsiderado um vídeo om altadelidade.
O pro esso de inserção de uma mar a d'água é realmente el ou imper eptível
se seres humanos não onseguem distinguirum sinal originalde um sinal mar ado,
mesmoempossedeambospara omparações[27℄. Noentanto,quandoa omparação
podeserfeita,amínimamodi açãonosinaloriginalpodeserper ebidadependendo
daregião oumomentoanalisado. Comoo usuário de dados mar ados normalmente
não tem a esso aos dados originais, a omparação não pode ser realizada, sendo
su iente, dependendo da apli ação, que a mar a d'água seja imper eptível desde
que não olo ada ateste.
Neste trabalho, por exemplo, que trata de do umentos impressos, a versão
di-gital(pré-impressão) dodo umento mar adonão pre isaser ne essariamente
indis-tinguível da versão original. Apenas a versões impressas é que devem ser
per ep-tualmente idênti as.
2.2.2 Capa idade
áudio,a apa idadenormalmenterefere-seaonúmerode bits inseridosporsegundo.
Para vídeo,a apa idadepode referir-seaonúmerodebits adi ionadosem umúni o
quadro ounotempode um segundo. Diferentes apli açõesnormalmentene essitam
de apa idades diferentes. No aso de um padrão interna ional de atalogação de
imagens, por exemplo, a quantidade de informação razoável a ser inserida poderia
serequivalenteàquelausadaparaoISBN(InternationalStandardBookNumbering),
om aproximadamente
10
dígitos de imais. Visando um ban o de imagens interno, omo o de uma grande empresa ou hospital, esse número poderia ser menor. Jáquandoaapli açãoé ontrolede ópias(Seção2.1.3),apenas
1
bitpodesersu iente, istoé, épermitida(0
)ou não (1
) a reprodução.2.2.3 Robustez
Robustezrefere-seàresistên iadamar ad'águaadiferentesoperações omunsde
pro essamentode sinais. Algunsexemplosdessasoperações,referidas omoataques,
são ompressão om perdas (JPEG, JPEG2000, MP3, MPEG, et ), ltragens,
im-pressãoereaquisição oms anner,distorçõesgeométri as,reamostragens, onversão
digital/analógi a(D/A)eanalógi a/digital(A/D),entreoutras. Apesardena
maio-ria das apli ações a robustez ser uma ara terísti a desejada, a regra não é geral.
Umamar ad'águaquetem omofunção provaraautenti idadede umdeterminado
sinalnãone essitaser robustaaté ni aalgumadepro essamento,pelo ontrário,já
que uma falhanadete ção damar a d'águaindi a queo sinal foi modi adoe não
é mais autênti o. Os ataques podem ser algumas vezes inten ionais, feitos
espe i- amente para eliminar ou estragar a mar a d'água. No aso de ataques não
inten- ionais, normalmente sepode fazeruma predição razoável dos tipos mais prováveis
de ataques aos quais o onteúdo será submetido após a inserção da mar a d'água.
Além disso, a robustez de uma mar a d'água pre isa irsomente até o determinado
pontoem queum pro essoqueretireamar ad'águanão daniqueexageradamente
osinal. Apartirdesseponto,o onteúdoperdeoseuvalorenão hámais razãopara
estar mar ado.
2.2.4 Segurança
Diferentedarobustez, querela ionaamar ad'águaà sua apa idadede resistir
a ataques em geral, a segurança refere-se à habilidade do sistema para resistir a
ataques mali iosos, ou inten ionais. Como foi men ionado, um ataque inten ional
tem omo nalidade frustrar o objetivo da presença da mar a d'água. Exemplos
A remoção da mar a d'água pode o orrer de duas maneiras: através da
elimi-nação ouatravés domas aramento damar a d'água. A eliminaçãovisa dani ar a
mar ad'água(tornando-a indete tável)fazendo omqueo sinalmar adoque
per- eptualmenteindistinguíveldooriginal,nãopare endo ontermar ad'águaalguma.
Já o mas aramento pro ura fazer om que a mar a d'água seja indete tável, ainda
queestejapresentenosinal. Umexemploseriaumaleverotaçãoemumaimagem. A
informaçãoadi ionada ainda estaria ontida na imagem,porém para uma dete ção
bem su edida dever-se-ia des obrir o tipode ataque feitoe ompensá-lo.
Observe quea mar a d'águadeve sobrevivera modi açõesaté oponto em que
o sinal original é per eptualmentea eitável,poisa partir desse ponto o sinal perde
o seu valor.
2.2.5 Dete ção Cega e Não-Cega
Existem algumas apli ações em que o sinal original pode ser utilizado no
mo-mento da dete ção. Por exemplo, na proteção de direitos autorais, o algoritmode
extração da mar a d'água pode usar o sinal não-mar ado para en ontrar a mar a
d'água, sendo esse tipo de dete ção hamada de dete ção não- ega ou informada
(nonoblivious ou informed) [28℄. Salvo em algumas situações espe í as [6℄, o fato
depossuirosinaloriginalnormalmenteaumentasubstan ialmenteodesempenhodo
dete tor, já que o original pode ser subtraído do mar ado para resultar na própria
mar ad'água. Noentanto,namaioriadasapli ações, omoproteção ontra ópiase
indexação, porexemplo,osalgoritmosparaextraçãonãotêma essoàimagem
origi-nalnão-mar ada. Essetipodedete çãoéreferida omo egaoupúbli a(publi ,blind
ouoblivious). Issotornaadete ção maisdifí ilem muitassituações, prin ipalmente
quando o sinal mar adoé submetido adiferentes ataques.
2.3 Con lusões
Neste apítuloforamdes ritasdiversasapli açõesquepodem serimplementadas
omousodemar asd'água. Foramtambémapresentadasasprin ipaispropriedades
desistemasdemar ad'água,mostrandoqueaspropriedadesdesejadasnormalmente
dependemda apli ação, eque existe dependên ia entre elas.
O próximo apítulo apresenta sistemas lássi os de mar a d'água, dis utindo
algumasdas té ni asmais omuns. Espera-se queoentendimentodesses algoritmos
TÉCNICAS EXISTENTES
Este apítulo apresenta uma revisão de té ni as lássi as para mar as d'água
digitais. Essas té ni as são base para diversos trabalhos dis utidos na literatura.
Este apítulo édividido em duas partes. A primeiraparte, formadapelaSeção 3.1,
dis ute métodos tradi ionais tais quais espalhamento espe tral (spread spe trum
-SS), modulação por índi e de quantização (quantization index modulation - QIM),
e modi ações nos bits menos signi ativos. Essas té ni as podem ser apli adas
para quaisquer tipos de mídia. Apesar do algoritmo proposto no Capítulo 5 não
ser baseado em nenhuma desses métodos, estes são in luídos neste apítulo para
permitir aoleitor um melhor entendimentodométodoTLM proposto nesta tese.
A segunda parte do apítulo, formada pelas Seções 3.2 e 3.3, dis ute os efeitos
ausados pela impressão e o es aneamento, fo ando em algoritmosdesenvolvidos
espe i amenteparasobreviveraessepro esso. Essesmétodossão onhe idos omo
hard opy watermarking na literaturainglesa.
3.1 Métodos Clássi os
3.1.1 Método Bási o por Correlação
Sendo uma das mais té ni as de mar a d'águamais omuns, a té ni a de
espa-lhamentoespe traladi ionaumpadrãode ruído onhe idoaosinaloriginal. Seja
c
h
um sinal originalde dimensãoN
(uma imagem omN
pixels, porexemplo), e sejas
w
a versão mar ada desse sinal, também de dimensãoN
. O pro esso de inserção damar a d'água édado por:Figura3.1: Diagramailustrando a inserçãono domínioespa ial.
em que
w
r
éuma seqüên ia pseudo-aleatória (pseudo-random sequen e -PRS) om elementosw
r
i
geralmente normalmente distribuídos ou distribuídos de a ordo omw
r
i
∈ {±1}, i = 1 . . . N
. A semente ou haveκ
w
usada para gerar a seqüên iaw
r
deve ser onhe ida pelotransmissorepelore eptor. Umfatorde ganhoG
w
éusado para modularw
r
, ontrolando a robustez e a delidade da mar a d'água. Quanto maior oganhoG
w
,maior a robustez, porém menor adelidade.Um diagramailustrando um sistema de mar a d'águausando a equação (3.1) é
mostrado na Figura3.1.
Considerando um ataque aditivo genéri o, a equação (3.1) pode ser modi ada
para:
y
n
= s
w
+ n
c
(3.2)Nesta equação,
n
c
representa qualquer tipo de ruído aditivo de anal entre a inserção e a dete ção. Pode ser ruído bran o Gaussiano aditivo (additive whiteGaussian noise - AWGN), distorções devido a ompressão, ajustes no brilho,
on-traste ouvolume, dentre outros ataquesmali iososounão mali iososdis utidosnas
Seções2.2.3 e 2.2.4.
Para dete tar a mar a d'água em uma imagem possivelmente mar ada
s
w
′
(ou
y
n
′
seataquessão onsiderados), a orrelaçãoentres
w
′
e
w
r
é omputada,sendoquew
r
é gerada om a mesma sementeκ
w
do pro esso de inserção. Seqüên ia geradas om sementes diferentes normalmente apresentam uma baixa orrelação entre si.0
5
10
15
20
−0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Seed for Pseudo−Random Sequence
Correlation Coefficient
Figura3.2: Valor da orrelação para sementes diferentes. A posição 13 orresponde à
orrelaçãofeita oma semente orreta.
PRS gerada om a semente orreta e tende a ser baixo em imagens não mar adas
ou imagens mar adas om uma seqüên ia gerada om uma semente diferente. Isso
é ilustrado na Figura3.2, que mostra o resultado da orrelação entre uma imagem
mar ada om uma PRSgerada om asemente 13, e20diferentes PRSgeradas om
sementes variando entre 1 e 20. O alto pi o orrespondente à semente 13 indi a a
presença daquela PRS om altaprobabilidade.
Sejam a orrelação linear Cor(
·, ·
)e a estatísti a de dete çãod
c
denidas omo:d
c
,
Cor(y
′
n
, w
r
)
,
1
N
N
X
i=1
y
n
′
i
w
r
i
(3.3)em que
i
representa o índi e doelemento novetor.Para de idir se uma mar a d'água está ou não presente, é omum denir um
limiar
λ
. Se a orrelaçãod
c
ex ede um dado limiarλ
, o dete tor assume quey
n
′
ontém a mar ad'água
w
r
se:d
c
> λ
→ w
r
dete tadod
c
< λ
→ w
r
não dete tado(3.4)
Usando o método bási o des rito a ima, apenas 1 bit é inserido, representado
pela presença ouausên ia damar a d'água. Alternativaspara inserir mais de 1bit
Figura3.3: Diagramailustrando multiplexação por divisão deespaço.
mensagem, e multiplexação por divisão de ódigo ( ode division multiple a ess
-CDMA),baseadosemespalhamentoespe tral. Naseqüên iaatençãoespe ialédada
para SS-CDMA devido aoseu grande impa tona literaturaerelativae iên ia.
3.1.2 Mar as D'Água via SS-CDMA
Considere que é ne essário inserir em
c
h
não apenas um úni o bit, mas uma mensagemmulti-bitde omprimentoL
0
representadaporb
,b
= [b
1
, b
2
, . . . , b
L
0
], b
l
∈
{−1, +1}
.Usando CDMA tradi ional [1℄, um vetor de mar a d'água
w
m
de omprimentoN
égeradopara arregaramessagem ombinandoL
0
mar asde referên iaextraídas de um onjuntoW
. Assuma que ada mar a de referên iaw
rl
é uma seqüên ia de omprimentoN
normalmente distribuída.W = {w
r1
, w
r2
, . . . , w
rL
0
} , w
rl
i
∼ N (0, σ
2
w
r
)
(3.5)A mensagem
b
é espalhada em uma seqüên iaN
-dimensionalw
m
da seguinte forma:w
m
=
1
√
L
0
L
0
X
l=1
b
l
w
rl
(3.6)O somatório é multipli adopor
1/
√
L
0
para assegurar queσ
2
w
m
= σ
2
w
r
. O vetorA estatísti a de de isão
d
c
l
é usada para estimar o valor dol
-ésimo bit, sendo denida omo:d
c
l
,
Cor(s
w
, w
rl
) =
1
N
N
X
i=1
s
w
i
w
rl
i
(3.7)em que
l
representa o índi e da mar a de referên ia ei
representa o índi e do elemento novetor.3.1.3 Mar a D'Água via QIM
Modulaçãoporíndi ede quantização(QIM),assim omoSS, éuma dasté ni as
de mar a d'água mais dis utidas na literatura. Ini ialmente proposta por Chen e
Wornell [29, 30℄, QIM é um métodode dete ção ega no qual o sinal original
c
h
é quantizado de a ordo om ainformação aser inserida.Épossíveldes reverdeformaúni aumquantizadoratravésdeum onjunto
Q
de pontos de re onstrução em um espaçoN
-dimensional. Da mesma forma, é possível denir uma regra para atribuir um sinal de entrada de omprimentoN
a um dos pontos denidosemQ
. Aidéiafundamentaldeum sistemaQIMédes ritaaseguir:1. Ini ialmente, um onjunto de diferentes quantizadores
{Q
1
,
Q
2
, . . . ,
Q
N
M
}
é denido. O onjunto de índi es,M = {1, 2, . . . , N
M
}
, representa asN
M
possíveis mensagens que podem ser inseridas.
2. Para inserir uma mensagem
b
, o sinal originalc
h
é quantizado om o quan-tizadorQ
b
dec
para obter o sinal mar ados
w
, em queb
dec
é a representação de imal da mensagem bináriab
. O ruído de quantização introduzido orres-ponde à distorção devida à inserçãodamensagem.3. Nopro essodedete ção,osinalre ebido
y
n
équantizado omtodosos quanti-zadores{Q
1
,
Q
2
, . . . ,
Q
N
M
}
,eode odi adoren ontraoíndi edoquantizador que ontém opontode re onstrução mais próximoaosinal re ebido. Oíndi eorresponde à mensagem de mar a d'água
b
ˆ
estimada.A Figura 3.4 ilustra o pro esso de inserção usando QIM. Neste exemplo, 1 bit
é inserido de forma que
M = {1, 2}
. Portanto, dois quantizadores são ne essários, e o seus onjuntos de pontos de re onstrução orrespondentes em um espaçoN
-dimensionalsãorepresentadosnaFigura3.4 om◦
'se△
's. Parab = 1
,porexemplo, osinal originaléquantizado om oquantizador◦
,sendo ques
w
ées olhido omo o◦
mais próximodec
h
. Quandob = 0
,c
h
équantizado om o quantizador△
. Em ontraste om SS,que onsidera aimagemoriginal omouma fontede ruídoX
PSfrag repla ements
s
w
, ifb = 1
s
w
, ifb = 0
Figura 3.4: Ilustração simplesdoQIM. Ospontos identi adospor
◦
'se△
's orrespondema doisquantizadores diferentes. Seb = 1
, osinaloriginalc
h
équantizado para o◦
mais próximo. Seb = 0
, Osinaloriginal équantizado para o△
maispróximo.adaptada à imagem original, ofere endo uma alta apa idade quando a distorção
introduzidapelos ataquesépequena. Dis ussõesmaisdetalhadasarespeitode QIM
pode ser en ontrada em [5,6, 1℄.
3.1.4 Bits Menos Signi ativos
Ométodomaissimplesedemaisalta apa idadeparainserirumamar ad'água
em um sinal se dá através de modi ações nos bits menos signi ativos (least
sig-ni ant bits -LSB).Nesse aso, osLSB são modi ados de a ordo om a mensagem
desejada. Noentanto, essa té ni aapresenta muito pou a robustez e não é
normal-menteusadaemapli ações omoproteçãodedireitosautorais,jáqueumbaixonível
de ruído pode destruir ompletamentea mensagem inserida.
Poroutrolado,métodobaseadosemLSBsãobastanteefetivosparaautenti ação
de onteúdoatravésde inspeçãovisual, onde osbitsmenos signi ativossão
substi-tuídos por um logo binário, omo ilustrado na Figura 3.5, por exemplo. Qualquer
modi ação naimagemmar adaaltera ologo, fazendo om que sejapossível
deter-minar onde a imagem foi alterada. Na sua forma mais simples, esse método não é
muito seguro porque os bits menos signi ativos podem ser mantidos inalterados e
PSfrag repla ements
LSB Original Image
Figura3.5: Imagem de omposta emplanos debits.
3.2 Efeitos da Impressão e do Es aneamento
Esta seçãodes reve osefeitos dopro essode impressãoees aneamento.
Poste-riormente, naSeção3.3,algoritmosde mar ad'águaquesobrevivemaesse pro esso
são dis utidos. Adi ionalmente, um modelo de anal analíti o do pro esso PS é
apresentado no Capítulo4.
Quando umdo umentoéimpressoees aneado, odo umentoes aneado pode
pare er similar aooriginal,masé distor ido nopro esso. Dependendo dadistorção,
uma mar a d'água inserida pode se perder durante o pro esso. De fato, é possível
abordaroproblema sob umaperspe tivade omuni açõesetrataro anal PS omo
um anal de omuni ação, om uma dada resposta em freqüên ia, atrasos, funções
deespalhamentoeadiçãoderuído. Narealidade,quandoumdo umentoéimpresso,
a imagem original, e onsequentemente a mar a d'água inserida, são transmitidos
através de um anal ontínuo (o papel) e sofrem diversas distorções tais quais
uma restrição de energia devido à propriedade de transparên ia per eptual, essas
distorções não podem ser desprezadas. Portanto, é fundamental a obtenção de um
modelo teóri o apropriado,talqual o modeloapresentado noCapítulo4. Com esse
modelo, o problema pode ser ara terizado, servindo omo base para o
desenvolvi-mento de esquemas e ientes. A seguir, algumas das ara terísti as inerentes ao
pro esso de impressão ees aneamento são dis utidas.
3.2.1 Cara terísti as dos Dispositivos
Es aneamento
O pro esso de amostragem de um es aner é afetado prin ipalmente pelos
seguintes elementos:
•
O pro esso de amostragem de alguns es aners apresenta um pequena difer-ença entre adireção verti al e adireçãohorizontal. Aamostragem nadireçãohorizontalénormalmentefeita omdispositivosópti osapenas. Ao ontrário,
a amostragemna direçãoverti al éfeita através de amostragem ópti a e
sub-amostragem digital,normalmente ausando uma amostragem não uniforme.
•
Sabe-se a partir do teorema da amostragem [33℄ que a freqüên ia de amostragem deve ser ao menos duas vezes maior que a maior freqüên iapre-sentenosinalaser amostrado. Emumes aner, osistemaópti o ombinando
lentes e espelho fo a o ampo de visão sobre o CCD ( harge oupled devi e)
paraaquisição. Osistemaópti oé onstruídode formaa ausaruma
freqüên- iade ortequeltra asfreqüên iassuperioresàquela orrespondente àmaior
freqüên ia de amostragem disponívelno dispositivo.
•
Ome anismoquesemoveaolongodadireçãoverti al ontémosistemaópti o eoblo odeCCD's, eproduzamostrasnaresoluçãodesejada. Esseme anismonão pausa o seu movimento quando as élulas de CCD estão em pro esso de
aquisição e sendo arregadas. Por esse motivo, a imagem es aneada sofre
borramento eltragempassa-baixas.
As Figuras 3.6(a) e 3.6(b) mostram um diagrama de blo os do pro esso de
amostragem nas direções verti al e horizontal,respe tivamente.
Impressão
Existem diversas te nologias de impressão de imagens. Exemplos in luem [34℄
(a)Direçãoverti al.
(b)Direçãohorizontal.
Figura3.6: Resumo dopro esso de es aneamento.
a impressão a laser e jato de tinta. Essas ofere em impressão de alta qualidade e
altodesempenhoapreçosa essíveis. Poressemotivo,estetrabalhofo anessestipos
de impressão, queusam te nologias de meio-tom, ou halftoning.
Halftoning refere-seaopro essonoqualumaimagem omdiversostons de inza
é transformada em uma imagempreta e bran a, devido àuma limitação datela de
exibiçãooudispositivodeimpressão. Essaimagem,quando riada omumalgoritmo
dehalftonebemprojetado,temaaparên iadeumaimagememtonsde inzaquando
vistade umadistân iaapropriada,devido à ara terísti ade ltragempassa-baixas
do sistema visual humano (Human Vision System - HVS) [35℄. Imagens oloridas
também são impressas em halftone [36℄, porém este apítulo fo a em imagens em
tons de inza apenas, visto que o fundamento dateoria pode ser estendido ao aso
olorido.
Existem três lasses de algoritmosde halftone bastante omuns: (
i
) té ni as de otimização;(ii
)ordereddithering;e(iii
)difusãodeerro. Deformageral,té ni asde otimizaçãoapresentamresultadosper eptuaisbastantesatisfatórios,porémapresen-tam uma alta omplexidade omputa ionalquando omparadas a outros métodos.
Por essa razão, apesar de populares, té ni as de otimização não são tão
freqüen-temente utilizadas quanto ordered dithering ou difusão de erro. Té ni as do tipo
ordered dithering são omumenteapli adasaimpressoras laser, enquantoque
té ni- as de difusão de erro é normalmenteutilizadaem impressoras jato de tinta.
Uma imagem halftone tem um espe tro largo, e a sua energia é on entrada
em harmni as da freqüên ia do halftone [37℄. Répli as diferentes no espe tro do
halftone es aneado sobrepõem-se, e os omponentes de freqüên ia podem formar
pi os quandosomados, ausando umpadrão periódi ovisível. Este padrãoé
3.2.2 O Pro esso de Halftoning
O algoritmoproposto no apítulo 5 trata imagens binárias que serão impressas
omo imagens em tons de inza. Nesse ontexto, um entendimento laro do
algo-ritmo de halftone usado no pro esso de impressão é fundamental, de forma que as
ara terísti asreais do sinal mar adosejam onhe idas.
Como dis utido na seção anterior, os dois tipos mais omuns de algoritmos de
halftone são: erro difusão e ordered dithering [40, 41, 42℄. A des rição a seguir é
fo adaemorderedditheringque, omalgumasvariações(dependendododispositivo)
é omumenteapli ado em impressoras laser modernas.
Seja
s
umaimagemdigitaldetamanhoM
′
× N
′
om
L + 1
níveisentre[0, 1]
(em que0representabran o e1representapreto). Umaimagemhalftone(binária)b
é geradaapartirdes
,usando oalgoritmoordered dithering. A essên iadesse método está no tamanho e nos oe ientes da matriz de quantização (matriz de halftone)D
H
de tamanhoJ
× J
, sendo que ada oe iente representa um limiar para a binarização. Cada oe ienteemD
H
re ebeumvalornoespaço{0, 1/L, 2/L, . . . , 1}
. Aimagembináriadesaídab
édadaporumaoperaçãode limiarizaçãoentreospixels ems
e os oe ientes emD
H
. Nos asos em que a resolução da imagem é igual à resoluçãodeimpressão,alimiarizaçãoéfeitaelemento-a-elemento,ouseja,umponto(pixel) na imagem orresponde a um ponto (preto ou bran o) na versão halftoned.
Se a resolução da imagem for menor que a resolução de impressão, ada pixel na
imagemoriginal será representada por váriospontos pretos e bran os.
Um diagrama de blo os dessa operação, om oe ientes da matriz de halftone
dados pelatradi ional matriz de Bayerem [43℄, émostrado na Figura3.7.
Em geral, o tamanho da matriz de halftone é muito menor que o tamanho da
imagem,ouseja,
J
≪ M
′
e
J
≪ N
′
. Portanto,
D
H
(m, n)
éperiodi amenterepli ado de formaqueD
˜
H
(m, n) = D
H
(m
modJ, n
modJ)
,emquemodéaoperaçãomódulo, etodaaimagemé oberta. A relaçãodeentrada esaídadoalgoritmopodedes ritamatemati amente omo:
b(m, n) = Q
H ˜
D
H
(m,n)
(s(m, n))
(3.8)=
0
ses(m, n) < D
H
(m
modJ, n
modJ)
1
aso ontrário (3.9)A saída `0' representa um pixel bran o (ponto não impresso), e `1' representa
um pixel preto (ponto impresso). Os valores dos oe ientes em