• Nenhum resultado encontrado

Análise de documentos questionados por espectroscopia Raman de imagem e análise de componentes independentes

N/A
N/A
Protected

Academic year: 2021

Share "Análise de documentos questionados por espectroscopia Raman de imagem e análise de componentes independentes"

Copied!
112
0
0

Texto

(1)

UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE QUÍMICA

CARLOS ALBERTO TEIXEIRA

ANÁLISE DE DOCUMENTOS QUESTIONADOS POR ESPECTROSCOPIA RAMAN DE IMAGEM E ANÁLISE DE COMPONENTES INDEPENDENTES

CAMPINAS 2016

(2)

CARLOS ALBERTO TEIXEIRA

ANÁLISE DE DOCUMENTOS QUESTIONADOS POR ESPECTROSCOPIA RAMAN DE IMAGEM E ANÁLISE DE COMPONENTES INDEPENDENTES

Dissertação de Mestrado apresentada ao Instituto de Química da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Química na área de Química Analítica.

Orientador: Prof. Dr. Ronei Jesus Poppi

ESTE EXEMPLAR CORRESPONDE À VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO ALUNO CARLOS ALBERTO TEIXEIRA, E ORIENTADA PELO PROF. DR. RONEI JESUS POPPI.

CAMPINAS 2016

(3)

Agência(s) de fomento e nº(s) de processo(s): CAPES

Ficha catalográfica

Universidade Estadual de Campinas Biblioteca do Instituto de Química Camila Barleta Fullin - CRB 8462

Teixeira, Carlos Alberto,

1989-T266a TeiAnálise de documentos questionados por espectroscopia Raman de imagem e análise de componentes independentes / Carlos Alberto Teixeira. – Campinas, SP : [s.n.], 2016.

TeiOrientador: Ronei Jesus Poppi.

TeiDissertação (mestrado) – Universidade Estadual de Campinas, Instituto deQuímica.

Tei1. Química forense. 2. Espectroscopia Raman. 3. Quimiometria. 4.

Espectroscopia Raman de imagem. 5. Análise de componentes independentes.

I. Poppi, Ronei Jesus,1961-. II. Universidade Estadual de Campinas. Instituto de Química. III. Título.

Informações para Biblioteca Digital

Título em outro idioma: Questioned documents examination by spectroscopy Raman imaging and independent component analysis

Palavras-chave em inglês: Forensic chemistry

Raman spectroscopy Chemometrics

Raman spectroscopic imaging Independent component analysis

Área de concentração:Química Analítica

Titulação: Mestre em Química na área de Química Analítica Banca examinadora:

Ronei Jesus Poppi [Orientador] Mariana Ramos de Almeida Fabio Augusto

Data de defesa: 28-07-2016

(4)

BANCA EXAMINADORA

Prof. Dr. Ronei Jesus Poppi (Orientador)

Profa. Dra. Mariana Ramos de Almeida (DQ-UFMG)

Prof. Dr. Fabio Augusto (IQ-UNICAMP)

A Ata da defesa com as respectivas assinaturas dos membros encontra-se no processo de vida acadêmica do aluno.

Este exemplar corresponde à redação final da Dissertação de Mestrado defendida pelo aluno CARLOS ALBERTO TEIXEIRA, aprovada pela Comissão Julgadora em 28 de julho de 2016.

(5)

“Em tempos de ódio parece que nossa melhor saída é a transgressão pelo afeto”

- Jeferson Tenório

(6)

Dedico essa dissertação aos meus pais Antonio e Neusa, e ao meu irmão Cláudio (in memoriam).

(7)

AGRADECIMENTOS

Aos meus pais Neusa e Antonio, e a minha namorada Sofia, pelo carinho, apoio incondicional e compreensão.

Ao Professor Dr. Ronei Jesus Poppi, pela constante orientação, paciência, boas conversas e convivência agradável durante esses mais de dois anos.

Aos colegas do Laboratório de Quimiometria em Química Analítica (LAQQA): José Augusto (Guto), Mariana, Humberto, Javier, Carlos Diego, Guilherme, Luciana Oliveira, Débora, Luciana Terra, Hery, Felipe, Willian (Docinho) e Marina (Maminha). Os dois últimos companheiros desde a graduação.

Aos amigos de longa data: Filipe (Humanas), Luís (Bowser), Bruno (Chimbinha) e William (Tsubaza).

Aos professores Drs. José Augusto Rosário Rodrigues e Matthieu Tubino que, cada um à sua maneira, me ajudaram a escolher o caminho que segui.

Aos Professores Drs. René Nome e Celso Aparecido Bertran, e a Professora Dra. Teresa Dib Zamboni Atvars, cujos laboratórios foram locais de boas conversas e inúmeros cafés.

Aos colegas do Laboratório de Microfabricação e Filmes Finos (LMF) do Laboratório Nacional de Nanotecnologia (LNNano), que me acolheram bem, mesmo em um curto espaço de tempo.

Aos funcionários da Comissão de Pós-Graduação do IQ (CPG-IQ), não só pela presteza e gentileza, mas principalmente pela paciência em lidar com inúmeros erros de preenchimento de formulários, relatórios, e claro, essa dissertação.

Um agradecimento especial a Laura (Tia Lau), pelo suporte técnico nas análises de microscopia eletrônica.

(8)

RESUMO

Investigação de documentos questionados por espectroscopia Raman de imagem e Análise de Componentes Independentes

A metodologia proposta foi baseada na técnica de espectroscopia Raman de imagem e na utilização da Análise de Componentes Independentes (ICA, do inglês Independent Component Analysis) como ferramenta quimiométrica, permitindo a construção, identificação e separação matemática dos sinais das amostras, de modo não supervisionado.

Na primeira parte do estudo foram confeccionadas oito amostras constituídas de duas canetas esferográficas azuis diferentes suportadas em papel branco comum, simulando uma situação onde o numeral 30 foi transformado através de pequenos retoques no numeral 80. Para todos os casos foi possível recuperar os espectros puros de cada caneta, bem como seus mapas de concentração que nos dão uma ideia de como e onde essas tintas estavam distribuídas. Com esses resultados em mãos, quatro amostras de cheques adulterados em laboratório foram analisadas. Mesmo com uma matriz mais complexa, por conta dos sistemas de segurança das folhas de cheque, tanto informações espectrais quanto de concentração das canetas foram recuperadas com sucesso pelo método. Posteriormente, foram conduzidos experimentos onde mensagens escritas em folha sulfite tiveram seu conteúdo suprimido. Nos casos testados, com conteúdo impresso e manuscrito e variando-se a forma de ocultamento do conteúdo original, foi possível obter os perfis de concentração referentes ao conteúdo oculto, nos dando uma noção do que fora obliterado. Por último é apresentada uma alternativa para a análise de alteração por emenda, utilizando a Espectroscopia Raman Intensificada por Superfície (SERS). Como anteriormente, foi possível obter informações tanto espaciais quanto espectrais, no entanto dessa vez intensificadas pela técnica.

(9)

ABSTRACT

Questioned documents examination by Raman imaging spectroscopy and Independent Component Analysis

The proposed methodology was based on the Raman imaging spectroscopy and the use of Independent Component Analysis (ICA) as chemometrics tool, allowing the construction, identification and mathematical separation of sample signals, using a not supervised method.

In the first part of the study were made eight samples constituted of two strokes made by two different blue ballpoint pens in white office paper, simulating a situation where the number 30 has been turned through small touches on the number 80. In all cases it was possible to recover the pure spectra of each pen as well as their concentration maps that give us an idea of how and where these inks were distributed. With these results, four samples of adulterated check sheets were analyzed. Both spectral information as well as concentration of the pens were recovered successfully by the method. Subsequently, experiments were conducted in which messages written in white office paper had their content hidden. In both case tested, with printed and manuscript content, it was possible to obtain the concentration profiles for the hidden content, giving us a sense of the content that had been obliterated. Finally, it is presented an alternative for analysis of document changes by amendment, using Surface Enhanced Raman Spectroscopy (SERS). As before, it was possible to obtain as spatial as spectral information. However, this time the results were intensified by the technique.

(10)

LISTA DE ILUSTRAÇÕES

Figura 1. Partindo originalmente de R$100,00 (a), exemplos de fraudes por supressão (b), acréscimo (c) e emenda (d). ... 21 Figura 2. Representação esquemática dos diferentes tipos de espalhamentos que uma amostra pode sofrer ao entrar em contato com uma radiação monocromática. 24 Figura 3. Diagramas de energias envolvidas nos processos de espalhamento Rayleight e Raman (Stokes e Anti-Stokes), entre o estado fundamental (n0) e estados

virtuais com energia menor que o próximo estado eletrônico (n1). ... 26 Figura 4. Esquema ilustrado do movimento coletivo dos elétrons livres na direção oposta ao campo elétrico. Esse movimento leva a redistribuição do campo eletromagnético, resultando em regiões localizadas com altas intensidades de campo. ... 28 Figura 5. Arranjo dos dados obtidos pelo mapeamento Raman sobre uma região da amostra. Os eixos x e y são coordenadas espaciais da análise o eixo z corresponde as informações espectrais. ... 29 Figura 6. Levantamento dos artigos no ano de 2014, focados na análise de documentos questionados... 31 Figura 7. Imagens Raman dos cruzamentos de traços entre duas canetas de tinta azul a base de gel, em diferentes intervalos de tempos e variando a ordem de lançamento. ... 33 Figura 8. Representação gráfica do funcionamento do ICA. Sendo a matriz de dados (M) uma mistura linear de vários fatores (sn), o algoritmo proporciona o cálculo de uma

matriz de separação (W) que possibilita calcular a estimativa das componentes puras (ŝn) que compõe a amostra. ... 38 Figura 9. Representação esquemática da decomposição da ICA como a soma das componentes contidas e A e S, e seus respectivos significados químicos. ... 39 Figura 10. Matrizes U, S e V geradas pela decomposição por SVD. ... 42 Figura 11. Esquema representativo do processo de otimização da escolha de número de fatores envolvendo uma série de análises por ICA variando-se o número de componentes independentes em busca da maior correlação possível entre os espectros recuperados e os de referência. ... 43 Figura 12. Preparo das amostras de adulteração por emenda. Para cada amostra foram utilizadas duas canetas diferentes. A caneta utilizada para a confecção do

(11)

número 30 foi chamada de Caneta I (a), já a caneta usada para a adulteração de Caneta II (b). ... 49 Figura 13. Preparo das amostras de adulteração por emenda em folhas de cheque. Do mesmo modo descrito anteriormente a caneta utilizada para a confecção do número 30 foi chamada de Caneta I (a), já a caneta usada para a adulteração de Caneta II (b). ... 50 Figura 14. Confecção das amostras de alteração por supressão. As amostras impressas em preto tiveram seu conteúdo suprimido por canetas pretas, variando o modo de realizar a rasura... 51 Figura 15. Confecção das amostras de alteração por supressão. As amostras de alteração por escrita superposta onde conteúdo e adulteração foram feitas com canetas azuis diferentes. ... 52 Figura 16. Imagem da aplicação das nanopartículas de ouro concentradas sobre a região de interesse após adulteração. ... 54 Figura 17. Espectro da ftalocianina de cobre e sua respectiva estrutura (a) e espectros Raman das canetas esferográficas azuis: ASM (b), BIC (c), Uni-ball micro DELUXE (d), Injex Pen (e), PILOT SUPER GRIP 1.0 (f) e Uni-ball Signo (g), obtidos nas melhores condições para cada uma das amostras. ... 57 Figura 18. Tratamento dos conjuntos de espectros do mapeamento. Os 625 espectros sobrepostos (a) foram cortados na região de 364 a 1640 cm-1 (b) e então normalizados

(c). ... 58 Figura 19. A escolha do número de fatores na análise baseou-se na escolha de uma faixa aceitável de componentes pela fatoração SVD, analisado na forma de % de variância capturada (a). A partir disso foi realizada a correlação com a caneta de referência (b). ... 59 Figura 20. Amostra ASM x BIC em papel sulfite, seus respectivos mapas de concentração e espectros recuperados (em vermelho) em comparação com os espectros de referência (em azul), utilizando 50% da potência nominal do laser. .... 61 Figura 21. Imagens químicas e espectros recuperados (em vermelho) em comparação aos espectros de referência (em azul e preto) para a amostra Injex Pen x PILOT SUPER GRIP 1.0, utilizando 50% da potência nominal do laser. ... 63 Figura 22. Imagens químicas e espectros recuperados (em vermelho) em comparação aos espectros de referência (em azul e preto) para a amostra Injex Pen x PILOT SUPER GRIP 1.0, utilizando 50% da potência nominal do laser. ... 64

(12)

Figura 23. Imagens químicas e espectros recuperados (em vermelho) em comparação aos espectros de referência (em azul) para a amostra Injex Pen x PILOT SUPER GRIP 1.0, utilizando 10% da potência nominal do laser. ... 68 Figura 24. Confecção de uma amostra especial, onde uma caneta sem tinta foi utilizada apenas para deixar uma marca do número 30 sobre o papel. ... 71 Figura 25. Imagens químicas e seus respectivos espectros recuperados pelo método para a amostra especial. Em destaque o espectro referente a imagem que possibilitou a visualização da região onde a caneta foi pressionada. ... 72 Figura 26. Imagens químicas e seus respectivos espectros recuperados pelo método para a amostra especial. ... 73 Figura 27. Imagem recuperada para a região onde a caneta sem carga foi pressionada no papel (a) e espectros recuperados para as dez componentes encontradas (b), com destaque para o espectro (em vermelho) referente à imagem obtida à esquerda. ... 74 Figura 28. Imagens químicas e espectros recuperados (em vermelho) em comparação aos espectros de referência (em azul) para a amostra Injex Pen x BIC utilizando uma folha de cheque do denominado Banco 1. ... 76 Figura 29. Imagens químicas e espectros recuperados (em vermelho) em comparação aos espectros de referência (em azul) para a amostra BIC (por baixo) x ASM (por cima). ... 80 Figura 30. Imagens químicas e espectros recuperados pelo algoritmo (em vermelho), em comparação com os espectros de referência (em azul) para a amostra de adulteração por trancamento BIC x HP LaserJet Enterprise 500 Color M551 PCL6. Em I vemos também o espectro puro da caneta BIC (em preto), para efeito de comparação. ... 83 Figura 31. Espectro UV-Vis da suspensão de ouro coloidal. ... 87 Figura 32. Micrografias (TEM, a esquerda e SEM, a direita) da suspensão coloidal de ouro, para a solução diluída (a e b) e para a solução concentrada (c e d). ... 88 Figura 33. Imagens químicas e espectros recuperados, em comparação com os espectros de referência, para a amostra Injex Pen x PILOT SUPER GRIP 1.0. ... 89 Figura 34. Imagens químicas e espectros recuperados, em comparação com os espectros de referência, para a amostra Injex Pen x PILOT SUPER GRIP 1.0. ... 90 Figura 35. Espectros SERS (em preto) em comparação com os espectros Raman convencionais (em azul) para as canetas estudas. ... 92

(13)

LISTA DE TABELAS

Tabela 1. Relação do número de fatores que foram empregados em cada uma das amostras estudas na sessão 4.2.1. ... 60 Tabela 2. Resultados das análises de adulteração por emenda em papel sulfite, utilizando 50% da potência nominal do laser. Onde R² é a variância explicada pelo modelo; LOF é a falta de ajuste; r1,ICA e r2,ICA são os valores de correlação entre os

perfis espectrais das canetas 1 e 2, respectivamente, e os espectros recuperados pela ICA. ... 66 Tabela 3. Resultados para as análises com a variação da potência do laser entre 10% e 50% do valor nominal. Onde R² é a variância explicada pelo modelo; LOF é a falta de ajuste; r1,ICA e r2,ICA são os valores de correlação entre os perfis espectrais das

canetas 1 e 2, respectivamente, e os espectros recuperados pela ICA. ... 70 Tabela 4. Resultados finais das análises de adulterações em folhas de cheques com vários tipos de canetas. Onde R² é a variância explicada pelo modelo; LOF é a falta de ajuste; r1,ICA e r2,ICA são os valores de correlação entre os perfis espectrais das

canetas 1 e 2, respectivamente, e os espectros recuperados pela ICA. ... 78 Tabela 5. Resultado final das análises de trancamento de um conteúdo manuscrito em caneta esferográfica azul por outra caneta do mesmo tipo e cor. R² é a variância explicada pelo modelo; LOF é a falta de ajuste; r1,ICA e r2,ICA são os valores de

correlação entre os perfis espectrais das canetas 1 e 2, respectivamente, e os espectros recuperados pela ICA. ... 81 Tabela 6. Resultados gerais das análises de trancamento de um conteúdo impresso por uma caneta preta. Onde R² é a variância explicada pelo modelo; LOF é a falta de ajuste; rcaneta,ICA é o valor de correlação entre o perfil espectral da caneta e o espectro

recuperado pelo método. ... 85 Tabela 7. Resultados gerais das análises das amostras de falsificação por emenda através da Espectroscopia Raman Intensificada por Superfície (SERS). R² é a variância explicada pelo modelo; LOF é a falta de ajuste; r1,ICA e r2,ICA são os valores

de correlação entre os perfis espectrais das canetas 1 e 2, respectivamente, e os espectros recuperados pela ICA. ... 94

(14)

LISTA DE ABREVIATURAS E SIGLAS

BSS – Separação Cega de Sinais (do inglês, Blind Source Separation) DW – Durbin-Watson

FE-SEM – Microscopia Eletrônica de Varredura com Emissão de Campo (do inglês, Field Emission Scanning Electron Microscope)

FT-IR – Espectroscopia no Infravermelho por Transformada de Fourier (do inglês, Fourier Transform Infrared Spectroscopy)

FT-Raman – Espectroscopia Raman por Transformada de Fourier (do inglês, Fourier Transform Raman Spectroscopy)

GC-MS – Cromatografia Gasosa associada à Espectrometria de Massas (do inglês, Gas Chromatography–Mass Spectrometry)

HCA – Análise de Agrupamento Hierárquico (do inglês, Hierarchical Cluster Analysis) HOMO – Orbital Molecular Ocupado de mais Alta Energia (do inglês, Highest Occupied Molecular Orbital)

ICA – Análise de Componente Independentes (do inglês, Independent Component Analysis)

LOF – Falta de Ajuste (do inglês, Lack of Fit)

LUMO – Orbital Molecular Ocupado de mais Baixa Energia (do inglês, Lowest Unoccupied Molecular Orbital)

MCR – Resolução Multivariada de Curvas (do inglês, Multivariate Curve Resolution) MF-ICA –Análise de Componentes Independentes utilizando o Campo Médio (do inglês, Mean Field approaches Independent Component Analysis)

PCA – Análise de Componentes Principais (do inglês, Principal Component Analysis) PLS-DA – Análise Discriminante por Mínimos Quadrados Parciais (do inglês, Partial Least Squares Discriminant Analysis)

SERS – Espectroscopia Raman Intensificada por Superfície (do inglês, Surface Enhanced Raman Spectroscopy)

SPR – Ressonância dos Plásmons de Superfície (do inglês, Surface Plasmon Ressonance)

SVD – Decomposição em Valores Singulares (do inglês, Singular Value Decomposition)

TEM – Microscopia Eletrônica de Transmissão (do inglês, Transmission Electron Microscopy)

(15)

TLC – Cromatografia em Camada Delgada (do inglês, Thin Layer Chromatography) UV-Vis – Ultravioleta visível

(16)

LISTA DE SÍMBOLOS

∑ – Matriz de covariância A – Matriz de proporções (ou concentrações)

 – Polarizabilidade da molécula E – Magnitude do campo elétrico e – Vetor da matriz de resíduos E0 – Amplitude vibracional

M – Matriz do conjunto de dados observados

m – Vetor da matriz de dados

M-1 – Inversa da matriz do conjunto de

dados

n0 – Estado fundamental

0 –Frequência da radiação incidente

v – Frequência vibracional da

molécula

P – Momento dipolar

P(A) – Probabilidade a priori de A P(A|B) – Probabilidade a posteriori de A condicionada a B

P(B) – Probabilidade a priori de B

P(B|A) – Probabilidade a posteriori de B condicionada a A

q – Deslocamento do núcleo da molécula

r – Correlação

– Variância explicada Ŝ – Estimativa da matriz das componentes independentes S – Matriz das componentes independentes

ST – Transposta da matriz das

componentes independentes – Ruído gaussiano

t – Tempo

U – Matriz unitária

VT – Conjugado transposta da matriz

unitária V

W – Matriz de separação xy – Coordenada de um pixel Y – Vetor de referência

z – Eixo cartesiano, correspondente aos números de onda dos espectros Raman

(17)

SUMÁRIO

1. Introdução ... 19

1.1. Química forense e documentoscopia ... 20

1.2. Espectroscopia Raman e suas variantes ... 22

1.2.1. Espectroscopia Raman ... 22

1.2.2.Espectroscopia Raman Intensificada por Superfície ... 27

1.2.3. Espectroscopia Raman de Imagem ... 29

1.3. Avanços recentes na área ... 31

1.4. Análise dos dados ... 37

1.4.1.Análise de Componentes Independentes (ICA) ... 37

1.4.2.Escolha do número de fatores para as análises ... 41

1.4.3.Decomposição em Valores Singulares (SVD) ... 42

1.4.4.Correlação máxima com um vetor de referência Y ... 43

1.5.Validação dos dados ... 44

1.5.1.Variância explicada ... 44 1.5.2.Falta de ajuste ... 44 1.5.3. Coeficiente de correlação ... 44 2. Objetivos ... 46 2.1. Objetivo geral ... 47 2.2. Objetivos específicos ... 47 3. Experimental ... 48

3.1. Preparo das amostras analisadas por espectroscopia Raman ... 49

3.1.1. Amostras de alteração por emenda ... 49

3.1.2. Amostras de alteração por supressão ... 50

3.1.3. Aquisição dos espectros Raman de referência ... 52

3.1.4. Mapeamentos ... 52

3.2. Preparo das amostras analisadas por espectroscopia Raman intensificada por superfície (SERS) 52 3.2.1. Síntese da suspensão coloidal de ouro ... 52

(18)

3.2.3. Aquisição dos espectros SERS de referência ... 54

3.2.4. Mapeamentos ... 54

4. Resultados e discussões ... 55

4.1. Espectros Raman de canetas esferográficas azuis ... 56

4.2. Casos de alteração por emenda ... 57

4.2.1. Alteração por emenda em papel sulfite ... 60

4.2.2. Alteração por emenda em cheques ... 74

4.3. Casos de alteração por supressão ... 79

4.3.1. Alteração por supressão de amostras com conteúdo manuscrito ... 79

4.3.2. Alteração por supressão de amostras com conteúdo impresso ... 81

4.4. Espectroscopia Raman de imagem intensificada por superfície como alternativa para análises de documentos... 87

5. Conclusões ... 95

6. Referências ... 97

(19)

CAPÍTULO 1

(20)

1.1. Química forense e documentoscopia

A Química Forense é o ramo da Química que se ocupa da investigação forense no campo da química especializada, a fim de atender aspectos de interesse judiciário. Tal ramo da Química atende basicamente as áreas de estudos da Criminalística e da Medicina Legal. São de interesse da análise forense o estudo de resíduos de disparos de armas de fogo [1], explosivos [2]e incêndios [3],exames toxicológicos [4], na identificação de adulterações de cédulas de dinheiro [5], revelação de impressões digitais [6], adulterações em combustíveis [7] e alimentos [8], identificação de crimes ambientas[9] e também a análise forense de documentos [10]

.

Nesse ramo específico, o conjunto de exames técnicos e científicos recebem o nome de Documentoscopia, que é a parte da criminalística que estuda os documentos para verificar se são autênticos e, em caso contrário, determinar a sua autoria [11].

Um documento (do latim documentu) é qualquer forma de instrumento escrito que, por direito, faz fé daquilo que atesta, que de forma escrito ou impressa fornece informação ou prova [12]. Por conta dessa definição ampla, os documentos se apresentam em diversas formas como contratos, testamentos, cheques, petições, etc. Devido a importância de alguns documentos, estes muitas vezes são pivôs de investigações envolvendo bens e valores. Portanto, se faz necessário o desenvolvimento de métodos físicos e químicos de análise de autenticidade.

Documentos que apresentam sua autenticidade de alguma maneira contestada são classificados como questionados. Caracteriza-se como uma alteração toda modificação estrutural de parte ou do todo dos dizeres de um determinado documento [11]. Partindo do valor original do documento (Figura 1a), podemos destacar as seguintes práticas de alterações documentais:

• Alteração por supressão: o conteúdo original é escondido por uma ou mais rasuras (Figura 1b);

• Alteração por acréscimos: o conteúdo original é modificado pelo acréscimo de um número, letra, ou qualquer tipo de informação a mais (Figura 1c);

• Alteração por emenda: consiste em um acréscimo de traço, ou traços, a uma letra ou algarismo, de modo a alterar o seu significado ou valor (Figura 1d).

(21)

a) b)

c) d)

Figura 1. Partindo originalmente de R$100,00 (a), exemplos de fraudes por supressão (b), acréscimo (c) e emenda (d).

Independentemente do tipo de fraude, o estudo dos documentos questionados começa com um exame visual do perito, seguido por análises químicas e físicas. Dependendo da natureza do documento e da tinta há uma gama de técnicas analíticas disponíveis para o estudo do caso, tais quais cromatografia em camada delgada (TLC), espectroscopia no Infravermelho com transformada de Fourier (FTIR), cromatografia gasosa com detecção por espectrometria de massas (GC-MS), eletroforese capilar, espectroscopia de raios X, espectroscopia Raman, etc. [13].

Dentre todas as peculiaridades que amostras forenses podem apresentar de acordo com sua natureza, poderíamos apontar como uma característica comum sua escassez disponível para análise. Nesse sentido o uso de rotinas de análises que preservem a integridade das amostras forenses recebe destaque como, por exemplo, as técnicas espectroscópicas.

(22)

1.2. Espectroscopia Raman e suas variantes

1.2.1. Espectroscopia Raman

A espectroscopia Raman reúne certas características que são propícias para a área forense. A técnica permite a obtenção de informações que auxiliam na identificação de substâncias químicas, podendo ser aplicada a soluções, sólidos, óleos, fluídos corpóreos, etc. e sem a necessidade de pré-tratamentos específicos. Para a obtenção dos espectros, uma fonte monocromática de luz (ou um laser) incide na superfície da amostra. A radiação espalhada inelasticamente traz informações acerca da composição química da amostra analisada.

Basicamente a área da espectroscopia estuda a interação da luz com a matéria, de modo a determinar os níveis de energia dos compostos químicos [14]. O resultado direto que se oriunda desses tipos de análise são as diferenças de energias entre níveis, só então é possível estabelecer as posições relativas dos níveis energéticos.

A região do espectro em que cada tipo de transição é observada está relacionada com os tipos de níveis envolvidos no processo, normalmente:

 Ultravioleta/ visível: transições entre níveis eletrônicos na molécula  Infravermelho: transições entre níveis vibracionais na molécula  Micro-ondas: transições entre níveis rotacionais na molécula

Outra maneira de se observar espectros vibracionais indiretamente é através do espalhamento Raman, utilizando radiação e detectores para a região do UV-vis/ NIR [14].

O efeito Raman foi primeiramente previsto pelo físico teórico austríaco Adolf Gustav Stephan Smekal em 1923 e comprovado experimentalmente pelo físico indiano Chandrasekhara Venkata Raman em 1928 [15].

Classicamente, ao ser irradiada por uma fonte eletromagnética monocromática (um laser), uma molécula diatômica é induzida, pelo campo elétrico dessa radiação, por um momento dipolar (P) que é igual ao produto da polarizabilidade da molécula () com a magnitude do campo elétrico (E):

(23)

A polarizabilidade da molécula pode ser vista como uma constante de proporcionalidade na Equação 1, que fornece uma ideia da facilidade de deformação da nuvem eletrônica das moléculas quando em contato com um campo elétrico.

O campo elétrico (E) de uma fonte de luz monocromática pode ser descrito por:

𝐄 = 𝐄𝟎𝐜𝐨𝐬(𝟐𝛑𝐯𝟎𝐭) (2)

onde E0 é a amplitude vibracional e 0 é frequência da radiação incidente. Com a

interação da luz com a matéria, as nuvens eletrônicas das moléculas são perturbadas periodicamente com a mesma frequência do campo elétrico incidente (). Tal perturbação retira da posição de equilíbrio os elétrons das moléculas, criando uma separação periódica de carga entre as moléculas, o que recebe o nome de momento dipolar induzido (P). Tal efeito é passivo de observação através da radiação espalhada.

Quando a radiação eletromagnética interage com os elétrons e núcleos dos átomos, a radiação pode ser absorvida, transmitida ou espalhada. Quando a radiação é espalhada, a maior parte dos fótons são espalhados elasticamente, ou seja, a radiação espalhada tem a mesma energia (ou frequência) que a radiação incidida. Esse tipo de fenômeno recebe o nome de espalhamento Rayleigh, e não traz nenhuma informação a respeito da estrutura e composição das moléculas alvo. Entretanto, uma pequena fração da radiação é espalhada inelasticamente, ou seja, com energia diferente da incidida. Quando a energia espalhada é menor que a incidida, o espalhamento é chamado de Stokes, quando a energia é maior, denomina-se espalhamento anti-Stokes (Figura 2).

(24)

Figura 2. Representação esquemática dos diferentes tipos de espalhamentos que uma amostra pode sofrer ao entrar em contato com uma radiação monocromática.

O modelo mais simples para o estudo das vibrações de uma molécula é o de massas pontuais, que representam os núcleos atômicos, ligados por molas de massas desprezíveis, representando as ligações químicas. Para qualquer perturbação desse sistema, com relação a posição de equilíbrio, haverá sempre uma força de restauração que obedecerá à Lei de Hooke [14]. O deslocamento do núcleo (q) para uma molécula diatômica pode ser descrito por:

𝐪 = 𝐪𝟎𝐜𝐨𝐬(𝟐𝛑𝐯𝐯𝐭) (3)

onde v é a frequência vibracional da molécula.

Combinando as equações 1, 2 e 3, e levando em consideração que a polarizabilidade () pode ser descrita como um desenvolvimento em série das coordenadas de deslocamento do núcleo (q):

ANALITO

Radiação monocromática

Espalhamento Rayleigh

Espalhamento Anti-Stokes

(25)

𝛂 = 𝛂𝟎+ (d

dq)0𝐪 (4)

Teremos que o momento de dipolo (P) pode ser descrito por:

𝐏 = 𝛂𝟎𝐄𝟎𝐜𝐨𝐬(𝟐𝛑𝐯𝟎𝐭) + (d

dq)0𝐪𝟎𝐄𝟎𝐜𝐨𝐬(𝟐𝛑𝐯𝟎𝐭) 𝐜𝐨𝐬(𝟐𝛑 𝐯𝐯𝐭) (5)

Desprezando os termos de ordem mais altas, já que são pequenos para uma pequena variação de q:

𝐏 = 𝛂𝟎𝐄𝟎𝐜𝐨𝐬(𝟐𝛑𝐯𝟎𝐭) +𝟏 𝟐(

d

dq)0𝐪𝟎𝐄𝟎{𝐜𝐨𝐬[𝟐𝛑(𝐯𝟎+ 𝐯𝐯)𝐭] + 𝐜𝐨𝐬[𝟐𝛑(𝐯𝟎− 𝐯𝐯)𝐭]} (6)

O primeiro termo contém somente a frequência da radiação incidente e corresponde ao espalhamento elástico (Rayleigh). No segundo termo aparecem radiações espalhadas com frequência menor que a incidente (Stokes) e maior que a incidente (anti-Stokes). Os últimos dois termos só terão contribuição se houver variação da polarizabilidade com o pequeno deslocamento da coordena q em torno da posição de equilíbrio, ou:

(d

dq)0 ≠ 𝟎 (7)

Em termos de mecanismos de espalhamento, estes podem ser representados pelo seguinte diagrama de energias (Figura 3):

(26)

Figura 3. Diagramas de energias envolvidas nos processos de espalhamento Rayleight e Raman (Stokes e Anti-Stokes), entre o estado fundamental (n0) e estados

virtuais com energia menor que o próximo estado eletrônico (n1).

No espalhamento Rayleigh, após a interação do fóton com a molécula, que estava no estado fundamental (n0), esta passa a um estado intermediário de níveis

virtuais, e decai em seguida para o mesmo nível de energia inicial e o fóton é espalhado sem haver modificação de energia (ou frequência). No espalhamento Raman Stokes a molécula, também no estado fundamental (n0), passa para um estado

virtual, após a colisão com um fóton, e decai em seguida para um estado vibracionalmente excitado (ainda no mesmo nível energético). Já no espalhamento Raman Anti Stokes a interação entre o fóton e a molécula ocorre em um estado vibracionalmente excitado e após essa interação a molécula passa para um estado virtual, e decai para o estado fundamental (n0)

Quando a energia do fóton incidente tem comprimento de onda situado dentro de uma banda de absorção intensa do composto, ou seja, essa energia é grande o suficiente para possibilitar uma transição eletrônica, há uma intensificação do sinal Raman das espécies presentes na amostra. Esse efeito é conhecido com Raman Ressonante.

Algumas desvantagens da técnica residem na interferência causada pela fluorescência das amostras e na baixa intensidade dos seus sinais devida à pequena secção transversal, algo em torno de 10-30 cm² por molécula. Em termos percentuais,

n

0

n

1

Rayleight

Stokes

Anti-Stokes

Estados

virtuais

(27)

significa que apenas 0,001% da radiação incialmente incidida será espalhada inelasticamente.

O uso da espectroscopia Raman já se mostrou útil na identificação de pigmentos de canetas a partir de espectros pontuais da amostra [17-18], porém a presença de compostos fluorescentes na superfície do papel pode mascarar o sinal Raman de interesse [17], diminuindo sua intensidade.

Para contornar tal problema, pode-se fazer uso de lasers na região do infravermelho próximo, que diminuem o efeito indesejado da fluorescência [18]. Outra maneira seria o uso da espectroscopia Raman intensificada por superfície, que além de eliminar tais tipos de interferência possibilita a intensificação do sinal Raman de algumas bandas seletivas, aumentando assim sua sensibilidade [19].

1.2.2. Espectroscopia Raman Intensificada por Superfície

O efeito SERS (Surface-Enhanced Raman Spectroscopy) foi reportado por Fleischmann et al. em 1974 [20] e possibilita a amplificação dos sinais Raman em algumas ordens de grandeza. Tal amplificação se deve à interação eletromagnética da luz com a superfície de metais, que produzem um grande aumento no campo do laser devido ao excitamento dos plásmons de superfície, causando o efeito de ressonância nesses plásmons. Para a ocorrência de tal efeito, as moléculas de interesse devem estar adsorvidas a superfície do metal ou, pelo menos, próximas (na ordem de 10 nm) [21].

O principal mecanismo responsável pelo efeito de amplificação do sinal está relacionado com o efeito de ressonância dos plásmons de superfície (SPR, do inglês Surface Plasmon Ressonance). Ele nada mais é do que a oscilação coletiva dos elétrons de valência de um metal quando estão em ressonância com a frequência da luz incidente [22]. Tal efeito se deve à interação eletromagnética da luz com a superfície de metais (normalmente nanopartículas), que produzem um grande aumento no campo do laser devido ao excitamento desses plásmons de superfície, causando o efeito de ressonância desejado (Figura 4). Esses plásmons de superfície podem ser interpretados como sendo a carga não compensada sobre a superfície das nanopartículas, fruto do deslocamento de elétrons livres na superfície metálica por conta do aumento do campo elétrico localizado.

(28)

Figura 4. Esquema ilustrado do movimento coletivo dos elétrons livres na direção oposta ao campo elétrico. Esse movimento leva a redistribuição do campo eletromagnético, resultando em regiões localizadas com altas intensidades de campo.

Se aproximarmos as nanopartículas metálicas como sendo pequenas esferas, com diâmetro da ordem de 10 – 100 nm, temos que suspensões aquosas desse tipo de material possuem uma grande área superficial. Nesses materiais nanoestruturados, por conta do efeito do confinamento quântico, o caminho médio livre dos elétrons excede o raio da partícula [23]. Dessa maneira essa grande área superficial apresentará alta densidade eletrônica. Como podemos tratar a intensidade Raman como sendo proporcional a intensidade do campo da radiação eletromagnética incidente, temos aí uma situação que possibilita a intensificação do sinal Raman de algumas ordens de grandeza.

Outro mecanismo envolvido no fenômeno de intensificação do sinal Raman, envolve a adsorção do analito na superfície do material nanoestruturado. Essa interação adsorbato-nanopartícula favorece a transferência de carga através de interações eletrônicas [21]. A transferência observada nesse tipo de fenômeno ocorre entre o orbital molecular ocupado de mais alta energia do analito (HOMO, do inglês Highest Occupied Molecular Orbial) e o de mais baixa energia, desocupado (LUMO, do inglês Lowest Unoccupied Molecular Orbital). Essa transferência é intermediada pelo metal nanoparticulado, de modo que os elétrons necessitem de menor quantidade de energia para tal feito.

Em termos de análise forense, a espectroscopia Raman intensificada por superfície foi empregada com sucesso na identificação de tintas em obras de arte [24], discriminação entre traços de canetas [26, 27] e pigmentos de tinta de impressora em papel [27].

(29)

1.2.3. Espectroscopia Raman de Imagem

Avanços na área de óptica, software e desenvolvimento de componentes eletrônicos, juntamente com o emprego de ferramentas quimiométricas, possibilitaram o surgimento de novas formas de utilização da espectroscopia Raman como ferramenta analítica. Nesse cenário, tomou forma o uso da espectroscopia Raman de imagem, que é uma extensão da espectroscopia Raman. A técnica possibilita a escolha de uma área da amostra onde um espectro é obtido em cada ponto xy (um pixel) da superfície da amostra. A resposta é um arranjo tridimensional onde xy são coordenadas do pixel e a terceira dimensão z corresponde aos números de onda do espectro. A Figura 5 mostra a organização dos dados obtidos por espectroscopia Raman de imagem.

Figura 5. Arranjo dos dados obtidos pelo mapeamento Raman sobre uma região da amostra. Os eixos x e y são coordenadas espaciais da análise o eixo z corresponde as informações espectrais.

A obtenção de informações por pixel gera um grande volume de dados por amostra analisada, justificando o uso da quimiometria. Normalmente a diferenciação entre pigmentos, na área da documentoscopia, se dá pela comparação visual do espectro como um todo, em busca de bandas em diferentes posições ou com intensidades relativas diferentes [18], porém ao mapear-se amostras que apresentam

(30)

cruzamentos de traços a resposta do equipamento sempre será uma matriz de mistura das informações provenientes das canetas, do papel e de tudo o mais que estiver sobre a superfície da amostra. Além disso, tintas são misturas complexas e, muitas vezes, sua formulação não é divulgada, portanto a atribuição de todas as bandas de um espectro, visando uma análise levando em consideração apenas uma única banda pode ser uma tarefa difícil. Nesse sentido o uso de métodos de resolução de curvas [28] e análise por componentes principais [24], bem como métodos de seleção de variáveis [28] são de grande utilidade para análise de dados espectrais de tintas.

(31)

1.3. Avanços recentes na área

De acordo com levantamento realizado por Matías Calcerrada e colaboradores [29], levando em consideração apenas as publicações na área do estudo de documentos questionados em 2014, 60% dessas publicações tiveram como objeto de estudo os pigmentos de canetas (Figura 6). Outros tipos de amostra como jatos, toners de impressora e o próprio papel tiveram menos destaque. Dentro dessa fração, mais da metade dos trabalhos se focaram no estudo de canetas esferográficas, tendo como maior objetivo (mais de 70%) a discriminação entre os pigmentos.

Figura 6. Levantamento dos artigos no ano de 2014, focados na análise de documentos questionados (adaptado de [29])

Em 2009, Irina Geiman e colaboradores realizaram estudos comparativos entre espectroscopia Raman e a Espectroscopia Raman Intensificada por Superfície (SERS, do inglês Surface Enhanced Raman Spectroscopy), de modo a provar a aplicabilidade da última como ferramenta analítica para a análise de corantes comumente encontrados em tintas de canetas esferográficas [19].

O trabalho baseou-se na análise de corantes puros (na forma sólida), pertencentes a dez classes distintas. Os espectros Raman foram obtidos com lasers de diferentes comprimentos de onda, variando da região do vermelho em 633 e 785

Canetas 62%

Impressões 15%

Papel 7%

Cruzamento de traços 8%

Outros 8%

Datação 28%

Discriminação 72%

Esferográficas

Desconhecidas Gel e rollerball Tinteira

(32)

nm com um FT-Raman da Bruker Optics Inc., até a região do infravermelho, com um Raman II FT-Raman também da Bruker Optics Inc. Já os espectros SERS foram obtidos de duas formas distintas. A primeira foi de forma direta, depositando-se 1 L de solução coloidal de prata, seguida de 0,5 L da solução do corante e então 1 L de solução de nitrato de potássio 0,5 mol.L-1, para promover a agregação das

nanopartículas. Esses espectros foram obtidos com lasers de 633 e 785 nm, nas mesmas condições da análise anterior. A segunda forma de aquisição dos espectros SERS apresentada neste trabalho constituiu-se na extração da tinta de documento (um asterisco feito de caneta azul sobre papel filtro) com etanol, seguido de separação por TLC. A análise das machas TLC por SERS se deu com adição de prata coloidal e nitrato de potássio diretamente sobre a fase estacionária da TLC.

Este estudo demonstrou que é possível obter espectros de alta qualidade a partir de amostras de corantes puros, utilizando a espectroscopia Raman, selecionando cuidadosamente a frequência de excitação. Porém os espectros SERS mostraram uma supressão dos sinais de fluorescência para os corantes de tinta esferográfica. Dos três comprimentos de onda de laser que foram avaliados, os melhores resultados foram observados quando se utilizou o laser em 1064 nm, para a espectroscopia Raman, por conta da menor interferência da fluorescência do papel nesse comprimento de onda. Os espectros de SERS obtidos após a extração da tinta da caneta esferográfica numa placa de TLC mostrou um elevado nível de consistência com o espectro do corante padrão. Em geral, o estudo demonstrou com sucesso a aplicabilidade da espectroscopia e Raman e SERS para a análise de corantes sintéticos encontrados em tintas de canetas esferográfica, apesar da etapa de separação tornar o processo muito laborioso.

Mais recentemente, no princípio de 2015, Carmen García-Ruiz e colaboradores [30] apresentaram resultados promissores no campo de estudo de intersecções de traços de canetas. O trabalho baseou-se na Espectroscopia Raman de imagem aliada a Resolução Multivariada de Curvas (MCR, do inglês Multivariate Curve Resolution), como ferramenta quimiométrica, demostrando o quão promissor a aliança de técnicas de imagens com métodos quimiométricos pode ser para a solução de crimes.

O objetivo principal do trabalho consistiu em determinar, dentre inúmeras amostras, a ordem de lançamentos dos traços de duas canetas azuis distintas. Ou seja, predizer quais das canetas estava por baixo (primeiro lançamento), e quais das

(33)

canetas estava por cima (2º lançamento). Para tal finalidade, foram utilizadas seis diferentes canetas adquiridas em lojas espanholas (Madrid). Os cruzamentos de traços foram todos preparados pela mesma pessoa, sem controle de pressão. O primeiro traço sempre foi uma linha horizontal, feita da esquerda para a direita. O segundo traço foi aplicado ortogonalmente variando o tempo de secagem do primeiro traço entre: 0h, 30 minutos, 5h, 2 dias e 1 semana. Para essa parte dos estudos utilizou-se papel sulfite comum, tipo office.

As amostras foram analisadas em um espectrômetro Thermo Scientific DXRTMxi Raman Imaging Microscope (Waltham, United States), com detector EMCCD

(Electron Multiplying Charged-Coupled Device). O laser utilizado foi na região do verde (532 nm) A área analisada foi de 600 x 600 m, o que inclui toda a intersecção dos traços, com um total de 5000 a 7000 espectros por amostra. Ao final de 90 análises realizadas, as imagens Raman foram obtidas pelo uso do algoritmo MCR.

Das 90 amostras analisadas, foi possível determinar corretamente a ordem de lançamentos dos traços em 60% dos casos. Os outros 40% tiveram seu julgamento prejudicado por conta da distribuição desigual da tinta, provocando dúvidas. Esses casos indefinidos foram mais acentuados para as amostras que tiveram seu tempo de aplicação entre traços reduzido (0h ou 30 minutos), já que estando a tinta de baixo ainda fresca, a mistura com a tinta de cima é favorecida (Figura 7).

Figura 7. Imagens Raman dos cruzamentos de traços entre duas canetas de tinta azul a base de gel, em diferentes intervalos de tempos e variando a ordem de lançamento (adaptado de [30]).

Tempo

(34)

Apesar das dificuldades encontradas, o trabalho apresenta uma alternativa promissora para a análise da superfície de cruzamentos de traços, já que além das respostas químicas (espectros) é possível obter a localização e distribuição dos pigmentos, graças as imagens geradas pelo MCR. Tudo isso de forma ágil e não destrutiva.

Ainda em 2015, Borba e seus colaboradores realizaram um estudo promissor no sentido de realizar uma prova de conceito, demonstrando a viabilidade de combinar a espectroscopia Raman com ferramentas quimiométrica para distinguir grupos de canetas esferográficas para aplicações forenses [31].

Para esse trabalho, 14 modelos de canetas esferográficas de diferentes marcas foram utilizadas. Para aumentar a representatividade do conjunto e estudar possíveis variações intra-classe, foram utilizadas 3 canetas por modelo/ marca que foram empregadas para a confecção de 7 traços de tinta sobre cada papel, totalizando 294 amostras. Os espectros Raman das amostras foram obtidos em um espectrômetro Horiba Jobin-Yvon LabRam HR800, equipado com um laser na região verde, em 532 nm. A potência do laser, o número de acumulações e o tempo de exposição foram ajustados de modo a se obter os melhores espectros possíveis sem haver a degradação das amostras.

Após o pré-processamento, a Análise de Componentes Principais (PCA) foi aplicada resultando em 4 grandes agrupamentos, dos quais 3 foram formados por apenas uma classe de caneta. A PCA foi aplicada novamente, mas desta vez apenas para o único agrupamento que possuía diferentes classes de canetas. A estratégia de realizar uma análise exploratória com todas as amostras, seguida da construção de modelos locais se mostrou promissora para esclarecer a estrutura das amostras em problemas particularmente complexos que envolvem um grande número de classes, com alguns tipos muito semelhantes de espectros. Essas observações foram confirmadas posteriormente com uso da Análise de Agrupamentos Hierárquicos (HCA), que também precisou ser realizada diminuindo-se o número de classes, agrupando tipos similares de pigmentos de modo a diminuir a complexidade dos modelos.

A próxima etapa desse trabalho foi a construção de modelos de classificação utilizando Análise Discriminante por Mínimos Quadrados Parciais (PLS-DA). Para tanto 7 modelos foram construídos, onde cada classe modelada foi formada por mais de um tipo de caneta, evidenciando mais uma vez a dificuldade em separar

(35)

as canetas por marcas ou modelos. Quanto maior a dificuldade na classificação, maior foi o número de variáveis latentes (VL’s) utilizadas para a predição correta, variando entre 2 e 5 o número de VL’s.

No geral as amostras conseguiram ser classificadas satisfatoriamente com erros menores ou iguais a 3%. Lembrando que as classes empregadas possuíam mais de uma marca/ modelo de caneta, não sendo possível a discriminação entre elas. Vale ressaltar que alguma caneta desconhecida que não pertence a nenhuma das classes propostas não poderia ser caracterizada por este método.

Nessa mesma direção de trabalho, André Braz e colaborares [32], em 2014, alcançaram resultados interessantes, principalmente na segunda parte do estudo, no que diz respeito a complexidade das formulações e a variabilidade na linha de produção que pode influenciar no produto final e consequentemente no trabalho de classificação.

Na segunda parte deste trabalho foram obtidos espectros Raman de 120 canetas de mesma marca e modelo, havendo apenas variação dos lotes (12 lotes) e anos de fabricação (2007 a 2013), totalizando 2 lotes por ano e 10 canetas por lote. Para cada uma das canetas foi analisada uma linha desenhada em papel sulfite comum, tipo office. As medidas foram realizadas em um espectrômetro Thermo Scientific DXR dispersivo, com comprimento de onda do laser de excitação na região verde (532 nm), com controle da potência de modo a não haver degradação das amostras.

Os resultados alcançados mostram que existe uma grande variabilidade entre os lotes fabricados em anos diferentes e até, em alguns casos, entre lotes fabricados no mesmo ano. As razões para tal são as mais variadas possíveis e englobam desde de mudanças na linha de produção até aspectos físicos da manufatura como temperatura e ordem de mistura dos componentes do pigmento. Apesar de tudo, os resultados indicam perfis espectrais semelhantes para cada lote estudado, o que sugere que cada um dos lotes analisados possui composições químicas semelhantes, ou no caso de serem diferentes a espectroscopia Raman não foi capaz de detectar tais diferenças.

De maneira geral a utilização da espectroscopia Raman e suas variantes no campo da análise de documentos questionados se mostra extremamente promissora. A característica que talvez mais propicie a disseminação da técnica no meio forense reside no fato de as técnicas espectroscópicas manterem a integridade

(36)

física e química das amostras coletadas. Quando, aliado a espectroscopia Raman, há o uso de ferramentas quimiométrica percebemos um ganho nas interpretações dos dados gerados. Tal aliança possibilita a aplicação de técnicas de exploração de dados, calibração e obtenção de imagens, tornando a análise forense mais rica e profunda. Algo a se considerar é que devido à alta complexidade das formulação e segredos industriais a espectroscopia Raman de maneira geral encontra dificuldades na caracterização e identificação dos pigmentos encontrados nas tintas, se limitando basicamente a discriminação entre traços, o que não é necessariamente um contratempo do ponto de vista forense

(37)

1.4. Análise dos dados

1.4.1. Análise de Componentes Independentes (ICA)

A Análise das Componentes Independentes (ICA, do inglês Independent Component Analysis) é uma técnica cega de separação das fontes (BBS, do inglês Blind Source Separation), bem estabelecida no ramo de processamento de dados em telecomunicações [33]e reconhecimento facial [34], e que vem ganhando aplicações em química analítica [35].

O método pertence a mesma classe de algoritmos da Análise das Componentes Principais (PCA, do inglês Principal Component Analysis), porém no primeiro assumimos que as componentes são totalmente independentes em vez de serem apenas não correlacionadas [36]. Outra vantagem da ICA com relação a PCA, é que esta utiliza o primeiro e segundo momentos dos dados medidos: tendência central (média ou centro da distribuição) e dispersão (variância ou sua raiz quadrada o desvio padrão) confiando assim, quase exclusivamente, na distribuição Gaussiana dos dados. Por sua vez, a ICA explora características intrinsecamente não-Gaussianas dos dados, empregando momentos mais altos, como a assimetria (indicação do grau de assimetria de uma função em relação a uma linha vertical que passa por seu ponto mais elevado) e curtose (define a forma ou gaussianidade da curva de função de distribuição de probabilidade dos dados) [37].

O objetivo da ICA, além de comprimir o conjunto de dados observados, é de extrair informações acerca das componentes puras, constituintes de uma mistura de proporções desconhecidas, utilizando apenas os dados obtidos experimentalmente [38]. Pensando em termos matemáticos, o algoritmo irá procurar uma matriz de separação (W), capaz de resolver a matriz de mistura dos dados (M), obtendo estimativas (ŝn) das fontes que, incialmente, formaram a mistura (sn) (Figura 8).

(38)

Figura 8. Representação gráfica do funcionamento do ICA. Sendo a matriz de dados (M) uma mistura linear de vários fatores (sn), o algoritmo proporciona o cálculo de uma

matriz de separação (W) que possibilita calcular a estimativa das componentes puras (ŝn) que compõe a amostra.

O algoritmo é utilizado para decompor o conjunto de dados, descrevendo-o em termdescrevendo-os de multiplicaçãdescrevendo-o de duas matrizes. O mdescrevendo-odeldescrevendo-o assume que um cdescrevendo-onjuntdescrevendo-o de sinais observados M é formado por contribuições lineares de fontes desconhecidas em S e suas proporções em A, que por sua vez são mutualmente e estatisticamente independentes. Se duas variáveis forem completamente independentes, a informação contida em uma variável não fornece nenhuma informação sobre a outra variável [39].

Matematicamente temos:

𝐌 = 𝐀𝐒𝐓 (8)

Em aplicações de espectroscopia de imagem as informações contidas em S e A sempre serão informações acerca dos espectros puros das fontes e suas distribuições sobre a superfície da amostra como demonstrado na Figura 9.

(39)

Figura 9. Representação esquemática da decomposição da ICA como a soma das componentes contidas e A e S, e seus respectivos significados químicos.

Uma vez que as informações sobre os coeficientes da mistura e das componentes independentes são desconhecidas, o papel da ICA será de encontrar uma matriz de separação W, que ao realizar uma transformação linear em M extraia as estimativas (Ŝ) das componentes S independentes:

𝐒̂ = 𝐖𝐌 = 𝐒 (9)

Ou seja, todo o trabalho da ICA consiste em encontrar uma matriz inversa de M de modo que:

𝐖 = 𝐌−𝟏 (10)

Enquanto o objetivo da PCA é minimizar os erros de projeção dos dados comprimidos em relação aos dados originais, o objetivo do ICA é minimizar a dependência estatística entre os vetores bases. Matematicamente, a ICA tentará

x

y M

x*

y

Espectros (Z) ICA

A

S

T NÚMERO DE CI’s NÚMERO DE CI’s

(40)

procurar uma transformação linear, através da matriz W, que minimize as dependências estatísticas das linhas de M [34].

Tendo a matriz S em mãos, as proporções em A podem então ser calculadas através de:

𝐀 = 𝐌𝐒𝐓(𝐒𝐒𝐓)−𝟏 (11)

De modo a auxiliar o modelo a chegar a resultados mais precisos e representativos é possível otimizar parâmetros tais quais restrições de não-negatividade nos valores de concentração (A) e nos espectros (S). Desse modo as respostas apresentarão apenas valores com significado químico.

Todo o processo de otimização é feito através de restrições de independência utilizando princípios de não gaussianidade (valores de curtose) como forma de estimar a independência estatística. O teorema do limite central admite que a função de densidade de probabilidade da soma de duas variáveis aleatórias é sempre mais próxima de uma distribuição Gaussiana do que as funções de densidade de probabilidade das variáveis originais [39]. Dessa forma, como os sinais observados são formados através da combinação linear das fontes, conclui-se que as fontes (S) são mais distantes do comportamento Gaussiano, do que a matriz de mistura (M).

Ao contrário da PCA, os vetores de base da ICA não são nem ortogonais nem classificados em ordem de importância. Além disso, não existe uma forma definitiva para encontrar W. Dessa maneira muitos algoritmos iterativos foram propostos como forma de obter a matriz de separação, e consequentemente, adquirir as informações relativas as fontes originais.

O MF-ICA (do inglês, Mean Field approach ICA) que foi utilizado no decorrer deste trabalho, foi proposto por Hojen-Sorensen et al [40], e é baseado na Teoria do Campo Médio (TCM) ou Teoria do Campo Auto Consistente. Em estatística, a TCM estuda o comportamento de padrões estocásticos, que são modelos cujos estados são indeterminados, com origem em eventos aleatórios.

No MF-ICA, o conjunto da mistura linear das fontes pode ser descrito como:

(41)

O algoritmo calculará, utilizando exclusivamente os dados contidos em M, a razão de verossimilhança (também conhecida como função Likelihood) da matriz de proporções A, da matriz de covariância ∑ e a estimativa dos sinais puros das fontes S. A função Likelihood é uma função de probabilidade dos parâmetros de um modelo estatístico [41]

A etapa limitante do processo de otimização é o cálculo da estimativa das fontes puras (Ŝ), para tanto se utiliza de cálculos de probabilidades condicionais, que podem ser alteradas a cada ciclo de transformações, utilizando o teorema de Bayes. Através da estatística Bayesiana é possível alterar os valores de probabilidades (probabilidade a posteriori) para um conjunto de dados, tendo em conta novas evidências [39], através de:

𝐏(𝐀|𝐁) =𝐏(𝐁|𝐀)𝐏(𝐀)

𝐏(𝐁) (13)

onde P(A) e P(B) são as probabilidades a priori de A e B, e P(A|B) e P(B|A) são as probabilidades a posteriori de B condicionada a A e de A condicionada a B, respectivamente.

As distribuições a posteriori representam a nossa informação atual sobre um parâmetro do sistema. A partir de novas observações podemos calcular novas distribuições de probabilidade (distribuição a priori), refinando as probabilidades a posteriori [39]. Esse ciclo de cálculos é repetido até que a razão de verossimilhança (ou plausibilidade) entre A, ∑ e S seja máxima.

Se tratando de um método de separação cega, é possível nomear como etapa crítica a escolha do número de fatores a serem empregados em cada análise, uma vez que tais fatores refletem diretamente o conjunto de estimativa dos sinais puros das fontes que o algoritmo será encarregado de encontrar.

1.4.2. Escolha do número de fatores para as análises

Como as respostas em S e A estão diretamente relacionadas com o número de componentes independentes na matriz M, a princípio desconhecidas, se torna crucial a determinação do número de fatores a ser empregado no modelo. Para tentar solucionar esse desafio pode-se fazer uso de algoritmos como a ICA por blocos (ICA-by-blocks) [42], que procura o número ideal de fatores na análise dividindo o conjunto

(42)

de dados em blocos, procurando componentes independentes extremamente correlacionadas em blocos diferentes, que nesse caso representariam o sinal puro das fontes originais. Outra saída seria o uso do método baseado no critério de Durbin-Watson (DW) [42], que se trata de um critério que mede a razão sinal/ ruído das respostas. Primeiramente, calcula-se a matriz de concentrações A utilizando de um até o máximo de componentes independentes possíveis. Posteriormente, utiliza-se a matriz residual de cada componente para obter uma estimativa do valor de DW. A análise dos valores de DW como uma função pode revelar o número de fatores a serem extraídos no modelo.

Nesse trabalho especificamente, utilizou-se o método de decomposição em Valores Singulares, SVD (Singular Value Decomposition), aliado ao cálculo do coeficiente de correlação entre as possíveis respostas geradas pelo algoritmo e um espectro de referência.

1.4.3. Decomposição em Valores Singulares (SVD)

A decomposição de uma matriz M de dimensões m x n pode ser descrita da seguinte forma:

M = USVT (14)

De modo que U é uma matriz unitária de dimensões m x m, S e uma matriz m x n (de modo que m < n) retangular e diagonal com números positivos, e VT é o

conjugado transposto da matriz unitária V, com dimensões n x n (Figura 10), todas determinadas simultaneamente [43].

(43)

A análise da diagonal da matriz S (compostas por valores positivos e únicos) pode ser usada como uma ferramenta para descrever os dados originais em vetores ortogonais linearmente independentes e, dessa maneira, fornecendo uma estimativa do número de componentes que estão variando independentemente na matriz de dados [44]. Esse número pode ser relacionado diretamente com o número de fatores que deve ser utilizado na ICA.

1.4.4. Correlação máxima com um vetor de referência Y

Usando como referência o espectro Raman da caneta que dentro da simulação disponibilizou a informação original do documento, buscou-se o número de componentes independentes que originasse a maior correlação entre seu espectro Raman e o recuperado pelo modelo. Após o desdobramento do cubo de dados aplicou-se a ICA na matriz desdobrada variando o número de componentes de acordo com o que fora observado no resultado da fatoração SVD, avaliando cada espectro recuperado com relação ao espectro de referência Y. Os maiores coeficientes de correlação foram armazenados na matriz r de correlação,que graficamente pode ser usada para uma possível estimativa do número de fatores que deve ser utilizado para a análise (Figura 11).

Figura 11. Esquema representativo do processo de otimização da escolha de número de fatores envolvendo uma série de análises por ICA variando-se o número de componentes independentes em busca da maior correlação possível entre os espectros recuperados e os de referência.

2 componentes independentes

3 componentes independentes

(44)

1.5. Validação dos dados

1.5.1. Variância explicada

Os resultados do ICA foram avaliados e comparados usando os parâmetros da porcentagem da variância explicada (R2) [45], que mostra quanto de M foi explicado

pelo modelo (Equação 5):

𝐑𝟐(%) = 𝟏𝟎𝟎 × (𝟏 − ∑ 𝐞𝐢𝐣 𝟐 𝐢𝐣 ∑ 𝐦𝐢𝐣𝟐 𝐢𝐣 ) (15)

onde eij são os elementos da matriz E de resíduos e mij são os elementos da matriz de dados M.

1.5.2. Falta de ajuste

A diferença entre a matriz de dados experimentais e os dados reproduzidos pelo modelo desenvolvido pelos métodos de resolução de curvas é chamada de falta de ajuste (LOF) [45], sendo calculada de acordo com a expressão abaixo:

LOF(%) = 100 x √∑ 𝒆𝒊𝒋 𝟐 𝒊𝒋 ∑ 𝒎𝒊𝒋𝟐 𝒊𝒋 (16)

onde eij são os elementos da matriz E de resíduos e mij são os elementos da matriz de dados M.

1.5.3. Coeficiente de correlação

O coeficiente de correlação entre os perfis espectrais recuperados pela Análise de Componentes Independentes e os espectros de referência podem ser calculados de acordo com a equação abaixo:

𝐫 = s

ty

(45)

onde s é um espectro recuperado pelo método e y é o perfil espectral de referência. Uma similaridade alta entre dois espectros é alcançada quando o coeficiente de correlação se aproxima 1.

(46)

CAPÍTULO 2

(47)

2.1 Objetivo geral

O objetivo geral do trabalho está em explorar e ampliar as possibilidades da análise forense, aliando a espectroscopia Raman de imagem e a Análise de Componentes Independentes como ferramentas analíticas aplicáveis em estudos de fraudes documentais.

2.2 Objetivos específicos

 Estudo exploratório para a identificação de possíveis fraudes por emenda envolvendo duas canetas esferográficas azuis em papel branco comum;  Aplicação da metodologia proposta em simulações de casos reais de

adulteração de cheques;

 Identificação do conteúdo de documentos impressos que tiveram seus teores ocultados por rasuras com canetas esferográficas pretas;

 Identificação de conteúdo manuscritos com tinta azul que foram ocultados por escrita superposta com outra caneta esferográfica azul;

 Análise alternativa utilizando a Espectroscopia Raman Intensificada por Superfície, para amostras de adulteração por emenda em papel sulfite comum, envolvendo duas canetas esferográficas azuis.

(48)

CAPÍTULO 3

Referências

Documentos relacionados

Contribuir para o desenvolvimento de produtos finais concretos (metodologias, processos, ferramentas de trabalho, políticas públicas, etc.), que sejam “novas portas

• The definition of the concept of the project’s area of indirect influence should consider the area affected by changes in economic, social and environmental dynamics induced

da resposta imune que, frequentemente, resultam em anular a ação de biopatógenos, por meio da ativação do sistema complemento, opsonização dos antígenos para

Esses vírus se ligam a receptores específicos localizados na superfície da membrana celular e entram na célula hospedeira via fusão do envelope viral, com a superfície da célula em

O artigo 2, intitulado “Tecnologias de Informação e Comunicação (TIC): Estar fora da família, estando dentro de casa”, foi resultado da realização de uma pesquisa de

1 Instituto de Física, Universidade Federal de Alagoas 57072-900 Maceió-AL, Brazil Caminhadas quânticas (CQs) apresentam-se como uma ferramenta avançada para a construção de

Todavia, nos substratos de ambos os solos sem adição de matéria orgânica (Figura 4 A e 5 A), constatou-se a presença do herbicida na maior profundidade da coluna

Este trabalho se justifica pelo fato de possíveis aportes de mercúrio oriundos desses materiais particulados utilizados no tratamento de água, resultando no lodo