• Nenhum resultado encontrado

ANÁLISE DISCRIMINANTE EM QUÍMICA FORENSE: APLICAÇÕES EM DOCUMENTOSCOPIA

N/A
N/A
Protected

Academic year: 2021

Share "ANÁLISE DISCRIMINANTE EM QUÍMICA FORENSE: APLICAÇÕES EM DOCUMENTOSCOPIA"

Copied!
43
0
0

Texto

(1)

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ COORDENAÇÃO LICENCIATURA EM QUÍMICA

CURSO LICENCIATURA EM QUÍMICA

LEONARDO VALDERRAMA

ANÁLISE DISCRIMINANTE EM QUÍMICA FORENSE: APLICAÇÕES EM DOCUMENTOSCOPIA

TRABALHO DE CONCLUSÃO DE CURSO

CAMPO MOURÃO 2015

(2)

LEONARDO VALDERRAMA

ANÁLISE DISCRIMINANTE EM QUÍMICA FORENSE: APLICAÇÕES EM DOCUMENTOSCOPIA

Projeto de pesquisa apresentado a disciplina de trabalho de conclusão de curso II (TCC II) do curso de Licenciatura em Química da Coordenação de Licenciatura em Química do Campus Campo Mourão da Universidade Tecnológica Federal do Paraná (UTFPR), como requisito para a obtenção do título de Licenciado em Química.

Orientadora: Profª. Drª. Patrícia Valderrama

CAMPO MOURÃO 2015

(3)
(4)

AGRADECIMENTOS

Agradeço a Deus por ter me permitido alcançar mais essa vitória.

Aos meus queridos e amados pais, Elizabeth Martins Valderrama e Osmar Valderrama , por todo esforço para comigo, carinho, apoio, incentivo, compreensão, força, confiança e amor.

Aos meu irmão Osmar Valderrama e minha irmã Patrícia Valderrama, que além de irmã foi minha professora, orientadora, amiga e conselheira, agradeço por ter me proporcionado tanta ajuda, incentivo e cobrança, sempre esperando o meu melhor.

Agradeço a minha cunhada Angélica e meu cunhado Paulo Henrique, que em muitos momentos foi muito mais que isso, sendo meu orientador e amigo.

À Universidade Tecnológica Federal do Paraná pela valiosa oportunidade concedida.

Aos professores Adriano Lopes Romero e Rafaelle Romero pela oportunidade de trabalhar dois anos como seu aluno de Iniciação Científica.

A todos os professores que me acompanharam nesta jornada, por todo apoio, incentivo e conhecimento.

Meu agradecimento especial a minhas queridas amigas Thays e Leticia, por todo carinho, apoio, paciência, cobrança, eu agradeço a vocês do fundo do coração, por terem feito parte desta jornada, tornando-a muito mais prazerosa e especial, desejo tudo de melhor em suas vidas.

Meu agradecimento minhas amigas: Hellen, Andressa, Géssica, Larissa, Bruna e amigos: Mateus, Caio, Tiago, Marcos, Vitor, Danilo, que com certeza tornaram estes quatro anos muito mais agradáveis e divertidos.

Agradeço a todos que de alguma forma contribuíram para este trabalho.

(5)

RESUMO

Valderrama, Leonardo. Análise discriminante em química forense: aplicações em documentoscopia. 2015. 43f. Trabalho de Conclusão de Curso (Licenciatura em Química) - Departamento Acadêmico de Química – DAQUI – Universidade Tecnológica Federal do Paraná. Campo Mourão, 2015.

A análise de tintas de canetas em papéis representa uma área importante na química forense, pois esta análise pode ser utilizada para identificar possíveis falsificações e alterações em um documento. Entretanto, muitos dos métodos instrumentais de análise são incapazes de realizar uma avaliação não destrutiva, o que representa uma séria limitação no campo da documentoscopia. Este trabalho propõe a aplicação do método de mínimos quadrados parciais com análise discriminante (PLS-DA) em imagens digitais obtidas a partir de smatphones (iPhone 5s e Motorola Moto G geração II) para a identificação não destrutiva de diferentes tipos de canetas azuis (Ballpoint, Rollerball, Gel e Felt-Tip) e a análise de cruzamento de traço em um documento que foi impresso depois escrito e em um documento que foi escrito depois impresso. Modelos PLS-DA foram desenvolvidos para cada um dos tipos de caneta e apresentaram sensibilidade igual a 1,0. A especificidade foi melhor nos modelos para as canetas do tipo Ballpoint e Gel. A robustez desses modelos, avaliada a partir de imagens obtidas de papel com diferente gramatura e a partir de um telefone Motorola, mostrou que o tipo de caneta Felt-Tip é o que produz o modelo mais robusto. Os modelos para a análise de cruzamento de traço apresentaram sensibilidades e especificidades iguais a 1,0. Neste caso, o modelo para a caneta do tipo Gel foi o único que se mostrou robusto com a mudança do tipo de impressora.

Palavras-chave: documentos, tintas de canetas, PLS-DA, discriminação, iPhone.

(6)

ABSTRACT

Valderrama, Leonardo. Discriminant analysis in forensic chemistry: applications in documentoscopy. 2015. 43f. Work completion of course (Degree in Chemistry) - Academic Department of Chemistry - DAQUI - Federal Technological University of Paraná. Campo Mourao, 2015.

The analysis of inks in paper represents an important area in forensic chemistry, since it can be used to identify possible falsifications and undue changes in a document. However, most of the instrumental methods are unable to perform a nondestructive analysis, which represent a serious limitation in document examination. This work proposes the application of partial least squares discriminante analysis (PLS-DA) method applied in digital images obtained from smartphones (iPhone 5s e Motorola Moto G II generation) for nondestructive identification of blue pen inks (Ballpoint, Rollerball, Gel and Felt-Tip) and crossed dash analysis in a document that was printed after writing and in a document that was written after printed. PLS-DA models were developed for each ink from different pen and showed sensitivity equal to 1.0. Specificity was better in the model for Ballpoint and Gel inks. The robustness of these models, measured from images obtained with different paperweight and from a Motorola phone, showed that Felt-tip ink produces the most robust model. The models for crossed dash analysis presented sensitivity and specificity equal to 1.0. In this case, the gel ink model was the only one that showed robustness when the printer was changed.

Keywords: documents, pen inks, PLS-DA, discrimination, iPhone.

(7)

LISTA DE FIGURAS

Figura 1. Construção da matriz X a partir de imagens digitais...23 Figura 2. Decomposição da matriz X em componentes principais por PCA...23 Figura 3. Decomposição das matrizes X e Y em variáveis latentes por PLS ...24 Figura 4. Imagem obtida através de um iPhone 5s para diferentes tipos de canetas azuis em papel com gramatura 140 g/m2 ...26 Figura 5. Imagens 15 x 15 pixels importadas para o Matlab...27 Figura 6. Esquema para a geração da matriz X a partir das imagens digitais...27 Figura 7. Previsão das amostras de calibração e validação no modelo PLS-DA. (A) Ballpoint;

(B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (o) amostras de validação Ballpoint. (+) amostras de calibração pertencentes a outras classes. (+) amostras de validação pertencentes a outras classes. (■) amostras

Felt- -Tip. (----)

threshold...28 Figura 8. Influência dos resíduos e do leverage nos modelos PLS-DA. (A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (o) amostras de validação Ballpoint. (+) amostras de calibração pertencentes a outras classes. (+) amostras de validação Rollerball. (♦) amostras de calibração G

Felt- -Tip...29 Figura 9. Influência da gramatura do papel na performance de previsão dos modelos PLS-DA.

(A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (●) amostras Ballpoint em papel com gramatura 75 g/cm2. (+) amostras de calibração pertencentes a outras classes.

(■) amostras de calibração Rollerball. (■) amostras Rollerball em papel com gramatura 75 g/cm2. (♦) amostras de calibração Gel. (♦) amostras Gel em papel com gramatura 75 g/cm2. (▲) amostras de calibração Felt-Tip. (▲) amostras Felt-Tip em papel com gramatura 75 g/cm2...30 Figura 10. Influência do smartphone na performance de previsão dos modelos PLS-DA. (A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (●) amostras Ballpoint obtidas a partir do smartphone Moto G. (+) amostras de calibração pertencentes a outras classes. (■) amostras de calibração Rollerball. (■) amostras Rollerball obtidas a partir do smartphone Moto G. (♦) amostras de calibração Gel. (♦) amostras Gel obtidas a partir do smartphone Moto G. (▲) amostras de calibração Felt-Tip. (▲) amostras Felt-Tip obtidas a partir do smartphone Moto G......31 Figura 11. Construção da matriz X a partir do cruzamento de traços...32 Figura 12. Canal RGB para as amostras de diferentes tipos de canetas nas situações 1 e 2. (A) Ballpoint na situação 1. (B) Ballpoint na situação 2. (C) Rollerball na situação 1. (D) Rollerball na situação 2. (E) Gel na situação 1. (F) Gel na situação 2. (G) Felt-Tip na situação 1. (H) Felt-Tip na situação 2...33

(8)

Figura 13. Previsão das amostras de calibração e validação das situações 1 e 2 no modelo PLS- DA. (A) Ballpoint na situação 1. (B) Ballpoint na situação 2. (C) Rollerball na situação 1. (D) Rollerball na situação 2. (E) Gel na situação 1. (F) Gel na situação 2. (G) Felt-Tip na situação 1. (H) Felt-Tip na situação 2. (●) amostras de calibração Ballpoint na situação 1. (●) amostras de calibração Ballpoint na situação 2. (o) amostras de validação Ballpoint na situação 1. (o) amostras de validação Ballpoint na situação 2. (■) amostras de calibração Rollerball na situação 1. (■) amostras de calibração Rollerball na situação 2. () amostras de validação Rollerball na situação 1. () amostras de validação Rollerball na situação 2. (♦) amostras de calibração Gel na situação 1. (♦) amostras de calibração Gel na situação 2.

() amostras de validação Gel na situação 1. () amostras de validação Gel na situação 2. (▲) amostras de calibração Felt-Tip na situação 1. (▲) amostras de calibração Felt-Tip na situação 2. () amostras de validação Felt-Tip na situação 1. () amostras de validação Felt-Tip na situação 2. (----) Threshold...35 Figura 14. Scores dos modelos PLS-DA na avaliação do cruzamento de traço. (A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint na situação 1. (●) amostras de calibração Ballpoint na situação 2. (o) amostras de validação Ballpoint na situação 1. (o) amostras de validação Ballpoint na situação 2. (■) amostras de calibração Rollerball na situação 1. (■) amostras de validação Rollerball na situação 2. (♦) amostras de calibração Gel na situação 1. (♦) amostras de calibração Gel na

Gel na situação 2. (▲) amostras de calibração Felt-Tip na situação 1. (▲) amostras de calibração Felt-

- ) amostras de validação Felt-Tip

na situação 2...36 Figura 15. Loadings dos modelos PLS-DA na avaliação do cruzamento de traço. (A) Ballpoint;

(B) Rollerball; (C) Gel; (D) Felt-Tip...37 Figura 16. Influência da impressora na performance de previsão dos modelos PLS-DA. (A) Ballpoint na situação 1. (B) Ballpoint na situação 2. (C) Rollerball na situação 1. (D) Rollerball na situação 2. (E) Gel na situação 1. (F) Gel na situação 2. (G) Felt-Tip na situação 1. (H) Felt-Tip na situação 2. (●) amostras de calibração Ballpoint na situação 1. (●) amostras de calibração Ballpoint na situação 2. (●) amostras Ballpoint na situação 1 impressora a laser. (●) amostras Ballpoint na situação 2 impressora a laser. (■) amostras de calibração Rollerball na situação 1. (■) amostras de calibração Rollerball na situação 2. (■) amostras Rollerball na situação 1 impressora a laser. (■) amostras Rollerball na situação 2 impressora a laser. (♦) amostras de calibração Gel na situação 1. (♦) amostras de calibração Gel na situação 2. (♦) amostras Gel na situação 1 impressora a laser. (♦) amostras Gel na situação 2 impressora laser. (▲) amostras de calibração Felt-Tip na situação 1. (▲) amostras de calibração Felt- Tip na situação 2. (▲) amostras Felt-Tip na situação 1 impressora laser. (▲) amostras Felt-Tip na situação 2 impressora a laser. (----) Threshold...38

(9)

LISTA DE TABELAS

Tabela 1. Quantidade de amostras dos diferentes tipos de canetas e suas características...21 Tabela 2. Parâmetros de qualidade dos modelos PLS-DA...28 Tabela 3. Quantidade de amostras empregadas na construção dos modelos PLS- DA...34 Tabela 4. Parâmetros de qualidade dos modelos PLS-DA na avaliação do cruzamento de traço...34

(10)

LISTA DE ABREVIATURAS E SIGLAS

HDR - High Dynamic Range HP – Hewlett-Packard

IUPAC – International Uinion of Pure and Applied Chemistry KNN – K-Vizinho mais próximo

PLS - Minimus Quadrados Parciais

PLD-DA – Parcial Least Squareweth Discriminant Analysis RMSECV – Erro Médio Quadrático de Validação Cruzada RMSEP – Erro Médio Quadrático de Previsão

SIMCA – Soft Independent Modeling by Class Analogy UV-VIS - Ultravioleta-Visível

VLs – Variáveis Latentes

(11)

SUMÁRIO

1 INTRODUÇÃO ...12

2 REVISÃO DE LITERATURA...13

2.1 DOCUMENTOSCOPIA...13

2.2 ÁNALISE QUÍMICA DE DOCUMENTOS ...15

2.3 QUIMIOMETRIA...16

2.4 IMAGENS DIGITAIS...17

2.5 CLASSIFICAÇÃO DE DADOS...19

3 OBJETIVO ...20

3.1 OBJETIVO GERAL...20

3.2 OBJETIVO ESPECÍFICO...20

4 METODOLOGIA...21

4.1 COLETA DAS AMOSTRAS...21

4.2 PLS-DA...22

5 RESULTADO E DISCUSSÃO...26

5.1 CLASSIFICAÇÃO DE DIFERENTES TIPOS DE CANETAS AZUIS...26

5.2 CRUZAMENTO DE TRAÇOS ...32

6 CONCLUSÃO...39

REFERENCIA...40

(12)

12

1 INTRODUÇÃO

Nas últimas décadas, o uso do conhecimento científico como ferramenta não apenas coadjuvante, porém muitas vezes decisiva, na elucidação de crimes, tem se intensifi cado.

Assim, a chamada Ciência Forense, estabeleceu-se de forma definitiva. Nela, a Química Forense tem um papel de grande destaque (FARIAS, 2010, p.103).

A Química Forense é definida como a utilização/aplicação dos conhecimentos da ciência química aos problemas de natureza forense (FARIAS, 2010, p.103). Um dos campos de atuação da Química Forense é a documentoscopia. A documentoscopia constitui-se da análise de tintas e papéis realizada para verificar a autenticidade de um documento e, em caso contrário, investigar a ocorrência de falsificação. Desta maneira, técnicas não destrutivas são geralmente preferidas nesse tipo de análise por preservarem a integridade do documento analisado (SILVA et al., 2013, p.59) e, nesse sentido, a análise de tintas de canetas já foi realizada por espectroscopia na região do ultravioleta-visível (SILVA et al., 2013, p.59) e empregando imagem hiperespectral na região do infravermelho próximo (SILVA et al., 2014, p.5176).

Apesar desses métodos serem não promoverem a destruição da amostra, normalmente o equipamento apresenta um custo elevado, não estando disponível em todos os laboratórios de análises forenses. Assim, as imagens digitais podem ser uma alternativa, e, para propósitos científicos, as imagens sempre são realizadas com objetivo de expressar algumas propriedades do objeto ou cena de interesse (GELADI; GRAHN, 1996).

Para que a imagem seja utilizada em trabalhos científicos esta deve ser expressa como uma função matemática (PATACA, 2006) que, aliada a quimiometria, pode ser utilizada para a construção de modelos matemáticos qualitativos.

Quimiometria consiste em aplicar métodos matemáticos e estatísticos em um conjunto de resultados de forma a extrair uma maior quantidade de informações (OTTO, 1999). No caso desse trabalho, o conjunto de resultados foi constituído por imagens digitais onde se aplicou o método supervisionado de mínimos quadrados parciais com análise discriminante (PLS-DA, Partial Least Squares with Discriminant Analysis). A execução deste trabalho permitiu desenvolver um método de análise de custo relativamente inferior, não destrutivo e eficiente para auxiliar a análise de falsificações em documentos. O método desenvolvido, além da simplicidade dos equipamentos utilizados, pode ser considerado um método rápido, que não necessita preparo de amostras e que não gera resíduos tóxicos colaborando, portanto, com os princípios da química verde ou química sustentável.

(13)

13

2 REVISÃO DE LITERATURA

2.1 DOCUMENTOSCOPIA

Do ponto de vista forense, a análise de composição química de papéis e tintas pode ser de grande valia na determinação da autenticidade ou não de um documento. Esta área da química forense é conhecida como documentoscopia. A doutrina nacional conceitua documentoscopia como:

O conjunto dos conhecimentos e recursos especializados de ordem técnico-científica que têm por objetivo a pesquisa, o estudo e a interpretação das falsificações e alterações de documentos, no que possam interessar ao esclarecimento e à prova de questões de fato, a serviço da justiça, tanto penal quanto civil. (RABELLO 1996).

Este conceito nos leva ao seguinte questionamento: O que pode ser caracterizado como sendo um documento? Segundo Costa 1995, documento é “todo e qualquer suporte que ostente o registro gráfico de uma ideia ou pensamento, normalmente representado por escrita sobre papel”. Dentro desta perspectiva o papel pode ter sido digitado ou manuscrito, a caneta ou a lápis. Embora atualmente exista muitos outros meios de se gerar informações, os documentos feitos de papel ainda continuam em destaque na sociedade atual e, na maioria das vezes, os documentos são assinados utilizando-se tinta.

Existe uma grande variedade de tintas de canetas, bem como diferentes nomenclatura s e classificações. De maneira geral, as tintas são constituídas por: colorante, veículo e aditivos (GONDRA, 2010).

Colorantes: são os responsáveis pela coloração. São divididos em corantes e pigmentos. Os corantes são solúvel no veículo enquanto os pigmentos são apenas finamente dispersos neste veículo. Veículos: são os responsáveis por dissolver ou dispersar os componentes da tinta mantendo-a homogênea. Dividem-se em solventes, são considerados a parte volátil do veículo e resinas responsáveis pelas características reológicas, como viscosidade e aderência. Aditivos: conferem características específicas ou pode-se dizer que melhoram o desempenho da tinta (RISTON 2014 p.307).

Portanto, em se tratando de tintas, a análise não apenas dos pigmentos (usualmente composto orgânicos ou óxidos metálicos), mas, também dos solventes ou outro tipo de substância empregada na formulação pode ser elucidativa (FARIAS, 2010, p.107).

Com relação aos tipos de canetas, elas se diferenciam muitas vezes pela composição química das tintas empregadas e as porcentagens utilizadas para a composição. Dentre os diferentes tipos, as mais utilizadas são:

(14)

14

1) Caneta esferográfica (Ballpoint): Emprega o mecanismo de esfera na ponta, possui uma tinta viscosa e insolúvel em água, contém uma complexa mistura de solventes, resinas, corantes e aditivos.

2) Caneta Rollerball: Utiliza a tecnologia de esfera na ponta, é composta em geral por solventes aquosos como veículo, portanto, a sua tinta é mais fluida se comparada às esferográficas.

3) Caneta Gel: Também possui o mecanismo de esfera na ponta, mas diferencia-se das Rollerball devido a sua tinta conter uma alta viscosidade e grande fluidez.

4) Caneta Felt-Tip: São canetas de ponta porosa e hidrográficas. Suas tintas possuem composição química semelhante às tintas das canetas Rollerball.

Dentre os constituintes do papel, o mais importante é a fibra celulósica, ainda que todos os vegetais possuam estas fibras, nem todas são viáveis para a produção de papel. No processo de fabricação do papel também são empregadas cargas (fillers), que são substâncias sob a forma de micropartículas utilizadas para dar volume e lisura ao papel, pois preenchem os vazios entre as fibras, além de aumentar a capacidade de absorção do papel. No entanto vários outros componentes podem ser adicionados ao papel, geralmente em baixa quantidade, como conservantes, corantes, entre outros. Porém, a importância desses constituintes menores para a documentoscopia é relativamente baixa (SILVA; FEUERHARMEL).

O papel possuí diversas características, como a tendência à dilatação quando exposto a umidade. Isso ocorre porque as fibras do papel são fortemente ligadas umas às outras, então qualquer variação individual irá se refletir por toda a trama. Outra característica importante para a documentoscopia é a espessura, que está relacionada com a distância entre duas faces de uma folha, geralmente expressa em micrômetros, e a gramatura que é a massa de um metro quadrado de papel, expressa em gramas (SILVA; FEUERHARMEL, 2014). Além disso, agentes externos de degradação dos papéis devem ser levados em conta, como os agentes físicos e químicos.

Os agentes físicos contribuem no processo de alteração das características dos papéis, sendo os mais comuns a radiação eletromagnética, a temperatura e a umidade. Os agentes químicos que mais alteram a composição e estrutura dos papeis são as reações de hidrólise, oxidação, fotoxidação, processos metabólicos e a catálise metálica (SILVA; FEUERHARMEL, 2014).

Impressos a jato de tinta consistem em textos e imagens “desenhados” diretamente no papel por ejeção de gotículas de tinta, cujas posições exatas são determinadas pelo software que gerencia o processo. Existem diversas maneiras da tinta ser ejetada para o papel e um deles é o sistema térmico, onde a tinta é aquecida até o solvente entrar em ebulição e formar uma bolha

(15)

15

que se expande, forçando uma quantidade controlada de tinta a sair pelo orifício (impressoras do tipo deskjet). Outro sistema de ejeção utiliza um cristal com propriedades piezelétricas, que se expande por ação da eletricidade. Uma terceira forma de ejeção de tinta, mais recente, trata- se da impressão eletrostática, no qual se forma um campo eletrostático entre o suporte e o orifício de impressão, produzindo um fino cone de tinta, cuja espessura pode ser controlada pela duração do pulso que gerou o campo elétrico (SILVA; FEUERHARMEL, 2014).

As impressoras a laser pertencem a família das impressoras eletroferográficas. Este modelo possui um cilindro com base de alumínio, revestido de material especialmente sensível à luz e a campos elétricos, os quais aplicam cargas negativas na superfície do cilindro de imagem. Em seguida, uma fonte de luz “varre” a superfície do cilindro, desenhando com pequenos pontos as imagens e textos a serem impressos. Nos pontos em que a luz é aplicada, as cargas elétricas são neutralizadas. Neste momento, as imagens a serem impressas estão gravadas na superfície do cilindro, sob a forma de cargas elétricas. Então aplica-se um pulso de luz e as imagens são formadas a partir de minúsculos pontos (SILVA; FEUERHARMEL, 2014).

Considerando os aspectos supracitados, o objetivo principal da documentoscopia é identificar a autenticidade de grafismo, mecanografias e documentos. Com relação à análise de fraudes em documentos pode-se identificar, por exemplo, a alteração ou a adição de escrita.

Outro campo de interesse na área da documentoscopia consiste na análise de traços. Nesse caso com o objetivo de verificar, por exemplo, se um documento foi impresso e depois assinado ou vice-versa.

2.2 ANÁLISE QUÍMICA DE DOCUMENTOS

A análise de documentos em perícia criminal envolve uma grande variedade de métodos, desde observação a olho nu até a utilização de equipamentos caros e sofisticados, tais como aqueles usados para a cromatografia, espectrometria de massas e espectroscopias Raman e na região do infravermelho (RISTON 2014).

A cromatografia é constituída de uma grande variedade de métodos de separação, desde métodos simples e corriqueiros como cromatografia em camada delgada, até métodos mais sofisticados como cromatografia gasosa. A União Internacional de Química Pura e Aplicada (IUPAC) define oficialmente cromatografia como “um método físico de separação no qual os componentes a serem separados são distribuídos entre duas fases, onde uma permanece fixa

(16)

16

(fase estácionaria) enquanto a outra se move (fase móvel) em uma direção definida” (McNAIR 1998).

Espectrometria de massas é uma técnica de detecção e identificação tanto de moléculas como de elementos químicos (HOLLER, 2009). A IUPAC define espectrometria de massas como “o ramo da ciência que lida com todos os aspectos de espectroscópios de massas e os resultados obtidos com estes instrumentos”.

A espectroscopia em geral também pode ser identificada como um conjunto de técnicas de detecção e identificação de moléculas e elementos, que pode ser entendida, basicamente como a ciência que estuda a interação da luz com a matéria (RISTON, 2014). A IUPAC define oficialmente espectroscopia como “o estudo de sistemas físicos por meio da radiação eletromagnética com as quais interagem ou que deles são produzidos”.

A espectroscopia Raman estuda o espalhamento da luz incidida sobre uma amostra. Esta pode ser considerada como uma técnica complementar à espectroscopia na região do infravermelho. O principal tipo de espalhamento ocorre sem mudança no comprimento de onda de quando a luz é incidida. Entretanto, a luz espalhada pode ter comprimento de onda maior ou menor, quando comparado à fonte de radiação (RISTON, 2014).

Atualmente, a análise de fraudes em documentos vem sendo realizada através de técnicas instrumentais como a espectroscopia Raman (RAZA; SAHA, 2013); (HEUDT et al, 2012); (BRAZ et al, 2013) e a espectrometria de massas (JONES; MCCLELLAND, 2013;

(HEODT et al 2012). Porém, essas técnicas tem como principal desvantagem a destruição da amostra que normalmente é um documento que serve como prova de um crime. Mais recentemente, métodos espectroscópicos não destrutivos vem sendo proposto para analisar documentos questionados (SOMMA et al, 2010). Estes métodos também vem sendo combinados a quimiometria para auxiliar na interpretação dos resultados obtidos (SILVA et al, 2014a; SILVA et al, 2014b; SILVA et al, 2014c). A principal desvantagem com relação ao uso espectroscopia está no custo elevado dos equipamentos.

2.3 QUIMIOMETRIA

A quimiometria pode ser definida como a pesquisa e utilização de métodos matemáticos e estatísticos para o tratamento de dados químicos, de forma a extrair uma maior quantidade de informações e melhores resultados analíticos (OTTO, 1999). Os métodos utilizados na quimiometria, a princípio, foram desenvolvidos em outras disciplinas que com a aplicação e

(17)

17

pesquisas voltadas para o tratamento de dados químicos acabou dando origem a uma nova área dentro da química analítica. Isso se deu após a segunda metade dos anos 60 com o surgimento de métodos instrumentais computadorizados para a análise química, que promoveu a geração de uma grande quantidade de dados. Assim, de todos os ramos da química clássica, talvez a química analítica tenha sido a mais afetada pelo desenvolvimento da instrumentação química associada a computadores (BRUNS; FAIGLE, 1985). Até então, os químicos analíticos baseavam suas decisões em uma pequena quantidade de dados que, na maioria das vezes, era obtida de forma lenta e dispendiosa (VANCÁRCEL, 1997).

Desde o surgimento da quimiometria até os dias de hoje foram desenvolvidos muitos métodos que tem tornado possível o processamento e interpretação de dados, que antes seriam impossíveis de serem analisados (VALDERRAMA, 2005, p.37). Um exemplo importante do sucesso da utilização da quimiometria são as análises realizadas a partir de imagens digitais (GELADI; GRAHN, 1996), as quais, sem o emprego de métodosquimiométricos, seriam impossíveis de serem interpretadas e utilizadas para análises qualitativas e quantitativas.

Com o crescimento da quimiometria foram desenvolvidas novas ferramentas para tratamento de dados encontrando aplicações distintas conforme o objetivo do estudo como, por exemplo, a otimização de processos, a classificação de dados e as determinações quantitativas.

Assim, a quimiometria foi dividida em diversas frentes de pesquisas e aplicações como o processamento de sinais analíticos, planejamento e otimização de experimentos, reconhecimento de padrões e classificação de dados, calibração multivariada e métodos de inteligência artificial (OTTO, 1999).

2.4 IMAGENS DIGITAIS

Para que uma imagem seja utilizada em trabalhos científicos esta deve ser expr essa como uma função matemática. No entanto, esta função matemática é, em geral, extremamente complexa para uma imagem contínua, o que tornam sua obtenção e tratamento tarefas de difícil execução. Deste modo, a função matemática contínua que descreve a imagem é convertida em uma função discreta através da digitalização da imagem. No processo de digitalização, uma imagem contínua é transformada em uma imagem digital que consiste em uma estrutura quadriculada, onde cada quadrado recebe o nome de pixel, o qual possui um valor de intensidade correspondente. O número de pixels de que é formada a imagem digital define a resolução espacial desta (GELADI; GRAHN, 1996).

(18)

18

No processo de aquisição das imagens são utilizadas uma das três técnicas: projeção, varredura ou tomografia. Alguns métodos são uma combinação de projeção e varredura. A projeção é a técnica normalmente usada na obtenção das fotografias e consiste na projeção da cena, através de uma objetiva, num material sensível a radiação ou detector. Na técnica de escaneamento o objeto a ser estudado é colocado entre a fonte de radiação e o detector. O objeto (ou detector, ou então a fonte de radiação) é movido ao longo da região que se deseja estudar.

A imagem é construída registrando-se a resposta do detector e a respectiva posição do objeto (PATACA, 2006, p.40).

O conceito de imagem multivariada está ligado a presença de vários canais (respostas) para o valor de intensidade do pixel (LIED; ESBENSEN, 2001, p.213) e seu desenvolvimento surgiu com o uso de imagens coloridas na microscopia ótica e continuou com a introdução de imagens espectrais nas várias áreas da ciência. Uma imagem multivariada 2D é, normalmente, apresentada como matriz de terceira ordem e é o caso mais simples de imagem multivariada.

A utilização de smartphones em estudos científicos vem ganhando cada vez mais destaque. Nesse sentido, encontram-se disponíveis na literatura, por exemplo, aplicações na área de medicina na detecção de compostos clinicamente relevantes (KWON, et al, 2014) e na área microbiológica em detecção bacteriana para o propósito de diagnóstico, detecção específica do componente bacteriano e detecção de células inteiras (GOPHNATH, et al, 2014).

Para serem utilizados na análise de documentos, os resultados, sejam obtidos por equipamentos analíticos ou as imagens digitais, necessitam ser transformar em informações que serão processadas computacionalmente, isto é, basicamente, um sistema de reconhecimento de padrões, que pode ser definido como um agrupamento de dados em classes que são criadas a partir de características do elemento analisado (MARTINEZ, 2014).

De acordo com Hall (1979), reconhecer padrões consiste em perceber ou identificar um elemento a partir de uma experiência passada ou conhecimento, ou por algum detalhe deste elemento. Este sistema de reconhecimento de padrões é constituído por algumas etapas.

Primeiro é preciso fazer a aquisição dos dados. Em seguida os dados passam pela etapa de pré- processamento, no qual é realizada uma segmentação da imagem para identificar regiões onde se encontra o que deseja-se identificar. Esta etapa é responsável pela separação da imagem em seus elementos constituintes. Em seguida é feita a extração de características; é a etapa que irá identificar e separar as características consideradas importante para o processo de classificação.

Então, característica neste caso são quaisquer medidas extraíveis de um padrão que podem contribuir para a classificação (MARTINEZ, 2014).

(19)

19

Dessa forma, um sistema de reconhecimento de padrões classifica os dados de entrada em uma ou mais classes (análise qualitativa), baseado nas características extraídas, que são organizadas em um vetor (JUSTINO, 2001).

2.5 CLASSIFICAÇÃO DE DADOS

A análise qualitativa estabelece a identidade química das espécies presentes em uma amostra (SKOOG et al, 2006, p.1). Os métodos quimiométricos de classificação de dados são considerados métodos de reconhecimento de padrões supervisionados. Para esses métodos são desenvolvidos modelos matemáticos para previsões categóricas, que podem ser: sim/não, espécie1/espécie2, dentre outras.

Os principais métodos quimiométricos de reconhecimento de padrões supervisionado são: O método K-vizinho mais próximo (KNN) (MASSART et al, 1988, p.395), modelos independentes de similaridade utilizando componentes principais (SIMCA) (MASSART et al, 1988, p.403), e mínimos quadrados parciais com análise discriminante (PLS-DA) (BARKER;

RAYENS, 2003).

KNN é um método de classificação baseado na similaridade. Quanto menor a distância entre as amostras, no espaço n-dimensional, maior a similaridade entre elas (MASSART et al, 1988, p.395). O principal problema relacionado a este método está no fato do não reconhecimento de amostras anômalas (outliers); todas as amostras serão previstas em uma determinada classe independente de pertencerem ou não àquela classe. O método SIMCA vem contornar este problema. Entretanto, este método funciona adequadamente quando a variabilidade entre os grupos é maior que a variabilidade dentro dos grupos. Quando a variabilidade dentro do grupo é maior que a variabilidade entre os grupos o método SIMCA não conseguirá distinguir entre os grupos. Para estes casos o método PLS-DA tem sido uma alternativa (PATACA, 2006, p.59). O PLS-DA é um método multivariado utilizado para classificação de amostras onde é necessário a redução de variáveis e não está claro se as diferenças entre grupos irão dominar a variabilidade total das amostras (BARKER; RAYENS, 2003). Com base no exposto, o PLS-DA foi o método empregado neste estudo e está descrito na seção métodos.

(20)

20

3 OBJETIVOS

3.1 OBJETIVO GERAL

Desenvolver um método de análise discriminante para avaliar fraudes em documentos empregando imagens digitais.

3.2 OBJETIVO ESPECÍFICO

- Desenvolver um método de análise para discriminar diferentes tipos de canetas utilizando imagens digitais obtidas a partir de um iPhone 5s.

- Avaliar a robustez dos métodos através da influência da gramatura do papel e do uso de um smartphone da marca Motorola modelo Moto G geração II na aquisição das imagens.

- Desenvolver um método de análise para discriminar amostras provenientes de cruzamento de traço.

- Avaliar a robustez desse método por meio da influência de impressoras que promovem a aplicação da tinta sobre o papel de formas diferentes.

- Colaborar para o desenvolvimento de metodologias analíticas de baixo custo e não destrutivas.

(21)

21

4 METODOLOGIA

4.1 COLETA DAS AMOSTRAS

Foram geradas amostras a partir de canetas dos tipos Ballpoint, Rollerball, Gel e Felt- Tip, cujas quantidades e características são apresentadas na Tabela 1.

Tabela 1. Quantidade de amostras dos diferentes tipos de canetas e suas características.

Tipo de

caneta Marca / Modelo Quantidade de amostras

Espessura da ponta (mm)

Tipo de ponta

Ballpoint Faber Castell / Medium 10 1.0

Esfera

Bic / Crystal 10 1.0

Rollerball Bic / 537 R Triumph 8 0.7

Esfera

Schneider Xtra 825 8 0.6

Gel Bic / velocity 8 0.7 Esfera

Felt-Tip Faber Castell / gripfinepen 8 0.4

Porosa

Paper Mate / Flair UF 8 0.4

Para cada uma das canetas foram feitos círculos preenchidos de diâmetro 0,5 cm em papel branco com gramatura de 75 g/m2 e 140 g/m2. As folhas de papel foram acondicionadas em embalagem plástica fechada e guardadas em ambiente escuro durante uma semana. Após esse período, uma imagem foi obtida dos respectivos papéis a partir de um celular iPhone 5s (câmera com resolução 8MP, modo HDR (High Dynamic Range) auto, sem flash) e de um celular Motorola Moto G geração II (câmera com resolução 8MP, modo HDR auto, sem flash).

Foram mantidas as mesmas condições de luminosidade do ambiente no momento de captura das imagens.

As imagens foram processadas com o auxílio do software Matlab R2007b e as ferramentas do pacote computacional PLS-Toolbox 5.2. Para a aplicação de análise discriminante às imagens obtidas, foi empregado o método supervisionado de mínimos quadrados parciais com análise discriminante (PLS-DA, Partial Least Squares with Discriminant Analysis).

Na sequência, foram geradas amostras para análise de cruzamento de traço em documentos em duas situações: 1) documentos que foram impressos e depois assinados (modo correto) e; 2) documentos que foram assinados e depois impressos (documentos fraudados).

(22)

22

Para tal, primeiramente foram impressos traços (tamanho da fonte 12, negrito), em duas folhas de papel branco com gramatura 140 g/m2 utilizando uma impressora a jato de tinta HP deskjet F4480 e uma impressora a laser Brother MFC-8912 DW. Também nessa aplicação, as folhas foram acondicionadas em embalagens plásticas fechadas e guardadas em ambiente escuro durante uma semana.

Paralelo a isso, em outras duas folhas de papel branco com gramatura 140 g/m2, foram feitos traços de 2 mm a partir das amostras das canetas apresentadas na Tabela 1. Da mesma forma, essas folhas foram acondicionadas em embalagens plásticas fechadas e guardadas em ambiente escuro durante uma semana.

Decorrido uma semana, as folhas que haviam sido impressas receberam um cruzamento de traço de 2 mm a partir de amostras das canetas. As folhas que haviam recebido os traços das diferentes canetas foram impressas, de forma a receberem um cruzamento de traço (tamanho da fonte 12, negrito), a partir da impressão através das impressoras citadas anteriormente. Na sequência, uma imagem foi obtida a partir de um iPhone 5s (câmera com resolução 8MP, modo HDR auto, sem flash). Essas imagens foram importadas para o software Matlab R2007b e foram utilizadas as regiões dos cruzamentos de traço para o desenvolvimento de modelos PLS-DA a partir das ferramentas do pacote computacional PLS-Toolbox 5.2.

4.2 PLS-DA

O método de reconhecimento de padrões supervisionado PLS-DA (BARKER;

RAYENS 2003 p.166) tem seu fundamento baseado no método de regressão por Mínimos Quadrados Parciais (PLS, do inglês Partial Least Squares) (GELADI; KOWALKI 1986 p.17).

Este, por sua vez, é baseado no método de reconhecimento de padrões não supervisionado conhecido como Análise de Componentes Principais (PCA, do inglês Principal Component Analysis) (WOLD 1987 p.37). O PLS-DA, o PLS e a PCA são métodos quimiométricos aplicáveis a dados de primeira ordem, ou seja, quando se tem um vetor de respostas para cada amostra (VALDERRAMA et al 2009), como, por exemplo, um espectro na região do ultravioleta-visível (UV-Vis), ou uma imagem digital que gera um espectro de cor. Para a utilização de qualquer um dos métodos, os vetores de dados são organizados no formato de uma matriz, conforme Figura 1.

(23)

23

Figura 1. Construção da matriz X a partir de imagens digitais.

Na PCA, a matriz X é decomposta em um produto de duas matrizes, uma matriz de scores (T) e uma matriz de loadings (P), conforme equação 1 (WOLD 1987 p.37). O conjunto de scores e loadings é denominado de Componentes Principais (PCs). A Figura 2 ilustra a decomposição da matriz X em scores e loadings até ‘A’ PCs.

X=TPT (1)

Figura 2. Decomposição da matriz X em componentes principais por PCA (OTTO 1999 p.197).

A matriz de scores fornece informações acerca das amostras na nova base vetorial, enquanto a matriz de loadings carrega as informações das variáveis.

A partir da PCA, foi originado o método de regressão PLS, que correlaciona, por mínimos quadrados, a matriz X com uma matriz Y contendo os valores de uma propriedade de interesse, como por exemplo, as concentrações de diferentes espécies ou analitos. Neste caso, as matrizes X e Y são decompostas em scores e loadings, enquanto cada PC sofre uma pequena modificação para buscar a máxima covariância entre X e Y. Assim, os PCs que são obrigatoriamente ortogonais, no método PLS recebe a terminologia de Variáveis Latentes (VLs) por perderem sua ortogonalidade (GELADI; KOWALKI 1986 p.17). A Figura 3 ilustra a decomposição das matrizes X e Y pelo método PLS.

(24)

24

Figura 3. Decomposição das matrizes X e Y em variáveis latentes por PLS (OTTO 1999 p.197).

Uma relação linear é estabelecida entre os scores de X e os scores de Y no cálculo dos coeficientes de regressão do modelo (b), ressaltando que nesse caso será obtido um vetor de coeficientes de regressão, um coeficiente de regressão para cada coluna de dados da matriz X (GELADI; KOWASLKI 1986 p.17).

No PLS-DA, a matriz Y contém informações acerca das classes de cada amostra e, por isso, o método de reconhecimento de padrões é dito supervisionado. A matriz Y assume valores iguais a 0 ou 1 indicando se a amostra pertence ou não à classe. Por exemplo, no caso de quatro classes e a amostra pertencendo à classe 2 o valor de y para esta amostra será y = {0 1 0 0}

(BARKER; RAYENS 2003 p.166). Os valores previstos pelo modelo PLS-DA serão idealmente os valores zero e um, sendo que, na prática os valores se aproximam destes. Ainda, é calculado um limite entre os valores previstos (threshold), onde valores acima deste limite indicam que a amostra pertence à classe modelada, enquanto que valores previstos abaixo deste limite indicam que a amostra não pertence à classe modelada (PATACA 2006).

A performance do modelo de classificação pode ser avaliada utilizando alguns parâmetros como a sensibilidade, especificidade e exatidão, representada pelos valores do erro médio quadrático de validação cruzada (RMSECV) e do erro médio quadrático de previsão (RMSEP).

A sensibilidade é a habilidade do modelo em classificar corretamente as amostras de validação pertencentes a uma determinada classe. Se o modelo classifica todas as amostras de uma determinada classe corretamente, então a sensibilidade para aquela classe será igual a 1. A especificidade está relacionada com a previsão incorreta de amostras de validação de outras classes em uma determinada classe. Dessa forma, se o modelo não erra na previsão de uma amostra esse modelo apresenta especificidade igual a 1 (ALMEIDA et al, 2013).

A exatidão expressa o grau de concordância entre o valor estimado pelo modelo e o valor tido como referência (VALDERRAMA; BRAGA e POPPI, 2009). Se os valores do

(25)

25

RMSECV forem superiores ao valor do RMSEP isso é um indicativo de exatidão do modelo e de que a escolha do número de variáveis latentes foi realizada adequadamente.

(26)

26

5. RESULTADOS E DISCUSSÃO

5.1. Classificação de diferentes tipos de canetas azuis

A Figura 4 apresenta a imagem obtida através de um iPhone 5s para diferentes tipos de canetas azuis em papel com gramatura 140 g/m2. Visualmente a distinção entre os diferentes tipos de caneta pode ser uma tarefa bastante custosa. Assim, as imagens foram utilizadas no desenvolvimento de modelos de classificação supervisionados a partir do método PLS-DA.

Para tanto, cada um dos círculos representa uma amostra, em que para cada imagem 15 x 15 pixels foram importados para o ambiente de trabalho do Matlab (Figura 5) gerando um tensor de dimensões {15,15,3}, em que o número 3 corresponde as variáveis R (vermelho), G (verde) e B (azul). As variáveis R, G e B podem assumir valores entre 0 e 255, então cada amostra , após desdobramento do tensor, gerou um vetor com dimensão 1 x 768 (256 possíveis valores para as variáveis R, G e B colocadas lado a lado nessa ordem). A partir do vetor de dados, para cada amostra, foi montada uma matriz X para cada um dos tipos de canetas, conforme Figura 6.

Figura 4. Imagem obtida através de um iPhone 5s para diferentes tipos de canetas azuis em papel com gramatura 140 g/m2.

(27)

27

Figura 5. Imagens 15 x 15 pixels importadas para o Matlab.

Figura 6. Esquema para a geração da matriz X a partir das imagens digitais.

A matriz X, para cada um dos tipos de caneta, foi dividida em dois conjuntos de dados, um conjunto de calibração e outro de validação. Um total de 15, 11, 5 e 11 amostras foram utilizadas no conjunto de calibração para os tipos de caneta Ball Point, Rollerball, Gel e FeltTip, respectivamente. No conjunto de validação, foram empregadas 5 amostras para cada caneta Ball Point, Rollerball e FeltTip e 3 amostra para a caneta do tipo Gel. Assim, foram utilizadas 42 amostras na calibração e 18 amostras no conjunto de validação.

Um modelo PLS-DA foi construído para cada tipo de caneta, com os dados centrados na média. O número de variáveis latentes foi escolhido de acordo com os valores do erro médio quadrático de validação cruzada (RMSECV) realizada em blocos contínuos de 5 amostras. A exatidão dos modelos, representada pelos valores de RMSECV e RMSEP, é apresentada na Tabela 2, juntamente com a sensibilidade e a especificidade.

(28)

28

Tabela 2. Parâmetros de qualidade dos modelos PLS-DA.

Tipo de caneta

Número

VL RMSECV RMSEP Sensibilidade Especificidade

Ball Point 2 0,571 0,360 1,000 1,000

Roller Ball 5 0,721 0,354 1,000 0,923

Gel 3 0,403 0,174 1,000 1,000

Felt-Tip 3 0,502 0,288 1,000 0,923

A exatidão dos modelos revelam que o número de variáveis latentes em cada um dos modelos foi escolhido apropriadamente. Os modelos para todos os tipos de canetas apresentaram sensibilidade igual a 1,0, o que indica que todas as amostras de validação foram previstas corretamente pelo modelo multivariado. Contudo, a especificidade dos modelos para os tipos de caneta Rollerball e Felt-Tip indicam que amostras não pertencentes a esses tipos de caneta foram previstas como sendo pertencentes, como pode ser comprovado através da Figura 7.

Figura 7. Previsão das amostras de calibração e validação no modelo PLS-DA.

(A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (o) amostras de validação Ballpoint. (+) amostras de calibração pertencentes a outras classes. (+) amostras de validação pertencentes a outras classes. (■) amostras de calibração Rollerball. () amostras de validação Rollerball. (♦) amostras de calibração Gel. () amostras de validação Gel. (▲) amostras de calibração Felt-Tip. () amostras de validação Felt-Tip. (---) Threshold.

(29)

29

Com base na Figura 7-B, uma amostra de validação que não era pertencente ao tipo de caneta Rollerball foi prevista em cima da linha do threshold para o modelo desse tipo de caneta.

Na Figura 7-D observa-se que uma amostra de validação não pertencente ao tipo de caneta Felt- Tip foi prevista acima da linha do threshold desse modelo, o que indica que essa amostra foi prevista como sendo pertencente a essa classe.

Outro quesito a ser levado em conta no desenvolvimento de modelos de classificação supervisionada é a presença de amostras anômalas (outliers). Como pode ser verificado na Figura 8, nenhum dos modelos para os diferentes tipos de caneta apresentou outliers, pois nenhuma amostra apresentou simultaneamente alto valor de leverage e alto valor residual (Q Residuals) com 99% de confiança.

Figura 8. Influência dos resíduos e do leverage nos modelos PLS-DA.

(A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (o) amostras de validação Ballpoint. (+) amostras de calibração pertencentes a outras classes. (+) amostras de validação pertencentes a outras classes. (■) amostras de calibração Rollerball. () amostras de validação Rollerball. (♦) amostras de calibração Gel. () amostras de validação Gel. (▲) amostras de calibração Felt-Tip. () amostras de validação Felt-Tip.

A robustez dos modelos desenvolvidos foi avaliada através da influência da gramatura do papel e do emprego de um smartphone de outra marca. No primeiro caso, adquiriu-se amostras com as mesmas canetas em um papel de gramatura 75 g/m2 e as imagens foram obtidas usando um smartphone iPhone 5s. Em um segundo momento, um smartphone Motorola Moto G geração II foi utilizado para adquirir imagens das amostras obtidas no papel de gramatura

(30)

30

140 g/m2. A Figura 9 apresenta os resultados para a influência da gramatura do papel, enquanto a Figura 10 ilustra o efeito da aquisição da imagem por meio de um smartphone de marca diferente da empregada na obtenção das imagens utilizadas na construção dos modelos.

Figura 9. Influência da gramatura do papel na performance de previsão dos modelos PLS-DA.

(A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (●) amostras Ballpoint em papel com gramatura 75 g/cm2. (+) amostras de calibração pertencentes a outras classes. (■) amostras de calibração Rollerball. (■) amostras Rollerball em papel com gramatura 75 g/cm2. (♦) amostras de calibração Gel.

(♦) amostras Gel em papel com gramatura 75 g/cm2. (▲) amostras de calibração Felt-Tip. (▲) amostras Felt-Tip em papel com gramatura 75 g/cm2.

Através da Figura 9 pode-se observar que a gramatura do papel não influenciou na previsão das amostras de canetas do tipo Gel e Felt-Tip. Entretanto, observou-se diferenças para as amostras do tipo Ballpoint e Rollerball. Isso pode ter ocorrido devido às diferenças no tipo da ponta dos diferentes tipos de caneta, além da característica física das tintas e suas composições químicas. Os tipos de caneta Ballpoint, Rollerball e Gel apresentam ponta do tipo esfera, entretanto, a Ballpoint é constituída por uma tinta viscosa e insolúvel em água enquanto a Rollerball, por conter solventes aquosos em sua composição, apresenta-se com uma tinta mais fluida. A caneta do tipo Gel, apesar de apresentar a mesma tecnologia de ponta do tipo esfera, é constituída por uma tinta de alta viscosidade e grande fluidez, o que sugere que sua tinta deve penetrar facilmente no papel, independentemente de sua gramatura. No caso da caneta do tipo Felt-Tip, por ser uma caneta hidrográfica, pode-se sugerir que esta é constituída por uma tinta

(31)

31

de alta fluidez e possui um sistema de dispersão (ponta) que permite que a tinta penetre no papel de tal maneira que faz com que a gramatura do papel seja indiferente.

Figura 10. Influência do smartphone na performance de previsão dos modelos PLS-DA.

(A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint. (●) amostras Ballpoint obtidas a partir do smartphone Moto G. (+) amostras de calibração pertencentes a outras classes. (■) amostras de calibração Rollerball. (■) amostras Rollerball obtidas a partir do smartphone Moto G. (♦) amostras de calibração Gel. (♦) amostras Gel obtidas a partir do smartphone Moto G. (▲) amostras de calibração Felt-Tip. (▲) amostras Felt-Tip obtidas a partir do smartphone Moto G.

Na Figura 10 verifica-se que o modelo para a caneta do tipo Felt-Tip foi o único que não sofreu influência com a mudança da marca do smartphone para a aquisição da imagem. O resultado apresentado pode ter decorrido em função da ponta porosa desse tipo de caneta e de seu menor diâmetro de ponta, que permite a geração de amostras mais homogeneame nte distribuídas sobre o papel e, consequentemente, imagens mais semelhantes independendo da marca do smartphone.

(32)

32

5.2. Cruzamento de traços

A Figura 11 apresenta um esquema de obtenção de dados para avaliar documentos em função do cruzamento de traços. Nesse sentido, é possível duas situações: 1) promover a impressão de uma folha de papel e após uma semana realizar o cruzamento de traços com diferentes tipos de canetas de cor azul; 2) delinear um traço (com diferentes tipos de canetas) em uma folha de papel e após uma semana essa folha ser impressa. Em ambos os casos, após uma semana da impressão ou do cruzamento do traço, uma imagem foi obtida através de um iPhone 5s. Visualmente fazer uma distinção entre as duas situações pode ser uma tarefa muito difícil. Portanto, o método PLS-DA, foi empregado para desenvolver modelos de classificação supervisionados. Para tanto, cada cruzamento de traço representa uma amostra, em que para cada imagem,7 x 15 pixels foram importados para o ambiente de trabalho do Matlab gerando um tensor de dimensões {7,15,3}, em que o número 3 corresponde as variáveis R (vermelho), G (verde) e B (azul). As variáveis R, G e B podem assumir valores entre 0 e 255, então cada amostra, após desdobramento do tensor, gerou um vetor com dimensão 1 x 768 (256 possíveis valores para as variáveis R, G e B colocadas lado a lado nessa ordem). A partir do vetor de dados, para cada amostra, foi montada uma matriz X para cada um dos tipos de canetas, nas diferentes situações.

Figura 11. Construção da matriz X a partir do cruzamento de traços.

(33)

33

Foram construídas matrizes, para cada um dos tipos de caneta, nas duas situações, como ilustra a Figura 12. Essas matrizes foram divididas em conjuntos de calibração e validação. No caso da caneta tipo Ballpoint foram empregadas 15 amostras da situação 1 e outras 15 amostras da situação 2 na construção da matriz X de amostras de calibração. Um total de 5 amostras de cada uma das situações foram utilizadas na construção da matriz de validação. A Tabela 3 apresenta a quantidade de amostras de cada situação utilizadas na construção dos conjuntos de calibração e validação.

Figura 12. Canal RGB para as amostras de diferentes tipos de canetas nas situações 1 e 2.

(A) Ballpoint na situação 1. (B) Ballpoint na situação 2. (C) Rollerball na situação 1. (D) Rollerball na situação 2.

(E) Gel na situação 1. (F) Gel na situação 2. (G) Felt-Tip na situação 1. (H) Felt-Tip na situação 2.

(34)

34

Tabela 3. Quantidade de amostras empregadas na construção dos modelos PLS-DA.

Tipo de caneta

Quantidade de amostras da situação

1 na calibração

Quantidade de amostras da situação

2 na calibração

Quantidade total de amostras na

calibração

Quantidade de amostras da situação

1 na validação

Quantidade de amostras da situação

2 na validação

Quantidade total de amostras na

validação

Ballpoint 15 15 30 5 5 10

Rollerball 12 12 24 4 4 8

Gel 5 5 10 3 3 6

Felt-Tip 12 12 24 4 4 8

Um modelo PLS-DA foi construído para cada tipo de caneta com os dados centrados na média. O número de variáveis latentes foi escolhido de acordo com os valores do erro médio quadrático de validação cruzada (RMSECV) realizada em blocos contínuos de 5 amostras. Os parâmetros de qualidade para os modelos desenvolvidos são apresentados na Tabela 4.

Tabela 4. Parâmetros de qualidade dos modelos PLS-DA na avaliação do cruzamento de traço.

Tipo de caneta

Número

VL RMSECV RMSEP Sensibilidade Especificidade

Ball Point 3 0,420 0,218 1,000 1,000

Roller Ball 4 0,495 0,293 1,000 1,000

Gel 2 0,329 0,055 1,000 1,000

Felt-Tip 3 0,449 0,281 1,000 1,000

A exatidão dos modelos, representada pelos valores de RMSECV e RMSEP, revelam que o número de variáveis latentes em cada um dos modelos construídos foi escolhido adequadamente. Os modelos para todos os tipos de canetas, nas duas situações possíveis, apresentaram sensibilidade e especificidade igual a 1,0, o que indica que todas as amostras de validação foram previstas corretamente pelo modelo multivariado e que nenhuma das amostras não pertencentes a uma das situações foram previstas como sendo pertencentes, como pode ser comprovado através da Figura 13.

(35)

35

Figura 13. Previsão das amostras de calibração e validação das situações 1 e 2 no modelo PLS-DA.

(A) Ballpoint na situação 1. (B) Ballpoint na situação 2. (C) Rollerball na situação 1. (D) Rollerball na situação 2.

(E) Gel na situação 1. (F) Gel na situação 2. (G) Felt-Tip na situação 1. (H) Felt-Tip na situação 2. (●) amostras de calibração Ballpoint na situação 1. (●) amostras de calibração Ballpoint na situação 2. (o) amostras de validação Ballpoint na situação 1. (o) amostras de validação Ballpoint na situação 2. (■) amostras de calibração Rollerball na situação 1. (■) amostras de calibração Rollerball na situação 2. () amostras de validação Rollerball na situação 1. () amostras de validação Rollerball na situação 2. (♦) amostras de calibração Gel na situação 1. (♦) amostras de calibração Gel na situação 2. () amostras de validação Gel na situação 1. () amostras de validação Gel na situação 2. (▲) amostras de calibração Felt-Tip na situação 1. (▲) amostras de calibração Felt-Tip na situação 2.

() amostras de validação Felt-Tip na situação 1. () amostras de validação Felt-Tip na situação 2. (----) Threshold.

(36)

36

Para explicar a distinção das amostras dos diferentes tipos de canetas nas duas situações pode-se recorrer aos scores e loadings dos modelos desenvolvidos. Analisando os gráficos dos scores, Figura 14, verifica-se que as amostras são separadas nas situações 1 e 2 pela primeira variável latente, no caso das canetas tipo Ballpoint, Rollerball e Gel, enquanto a segunda variável latente foi a responsável por esse tipo de separação entre as amostras da caneta do tipo Felt-Tip. Em todos os casos, as amostras na situação 1 encontram-se na parte negativa da variável latente enquanto que as amostras na situação 2 ficam na parte positiva.

Figura 14. Scores dos modelos PLS-DA na avaliação do cruzamento de traço.

(A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip. (●) amostras de calibração Ballpoint na situação 1. (●) amostras de calibração Ballpoint na situação 2. (o) amostras de validação Ballpoint na situação 1. (o) amostras de validação Ballpoint na situação 2. (■) amostras de calibração Rollerball na situação 1. (■) amostras de calibração Rollerball na situação 2. () amostras de validação Rollerball na situação 1. () amostras de validação Rollerball na situação 2. (♦) amostras de calibração Gel na situação 1. (♦) amostras de calibração Gel na situação 2. () amostras de validação Gel na situação 1. () amostras de validação Gel na situação 2. (▲) amostras de calibração Felt-Tip na situação 1. (▲) amostras de calibração Felt-Tip na situação 2. () amostras de validação Felt-Tip na situação 1. () amostras de validação Felt-Tip na situação 2.

Observando os loadings dos modelos na Figura 15, verifica-se que para as canetas do tipo Ballpoint e Rollerball na situação 1, os loadings negativos encontram-se em maiores valores dos canais R, G e B. Por outro lado, na situação 2, os loadings positivos sempre

(37)

37

apresentam-se em menores valores nos canais R, G e B. No caso das canetas do tipo Gel e Felt- Tip observa-se o contrário; Os loadings negativos da situação 1 para esses tipos de canetas encontram-se em menores valores nos canais R, G e B, enquanto que na situação 2, os loadings positivos estão em maiores valores nos canais R, G e B.

Figura 15. Loadings dos modelos PLS-DA na avaliação do cruzamento de traço.

(A) Ballpoint; (B) Rollerball; (C) Gel; (D) Felt-Tip.

A robustez dos modelos PLS-DA foi avaliada através da influência do emprego de uma impressora de marca e modelo diferentes em relação à impressora utilizada na etapa de desenvolvimento dos modelos. Para tal, adquiriu-se amostras com as mesmas canetas, nas duas situações, em um papel de gramatura 140 g/m2 e as imagens foram obtidas usando um smartphone iPhone 5s. A Figura 16 apresenta os resultados para a influência da impressora nos modelos PLS-DA na avaliação de cruzamento de traço.

(38)

38

Figura 16. Influência da impressora na performance de previsão dos modelos PLS-DA.

(A) Ballpoint na situação 1. (B) Ballpoint na situação 2. (C) Rollerball na situação 1. (D) Rollerbal l na situação 2.

(E) Gel na situação 1. (F) Gel na situação 2. (G) Felt-Tip na situação 1. (H) Felt-Tip na situação 2. (●) amostras de calibração Ballpoint na situação 1. (●) amostras de calibração Ballpoint na situação 2. (●) amostras Ballpoint na situação 1 impressora a laser. (●) amostras Ballpoint na situação 2 impressora a laser. (■) amostras de calibração Rollerball na situação 1. (■) amostras de calibração Rollerball na situação 2. (■) amostras Rollerball na situação 1 impressora a laser. (■) amostras Rollerball na situação 2 impressora a laser. (♦) amostras de calibração Gel na situação 1. (♦) amostras de calibração Gel na situação 2. (♦) amostras Gel na situação 1 impressora a laser. (♦) amostras Gel na situação 2 impressora laser. (▲) amostras de calibração Felt-Tip na situação 1. (▲) amostras de calibração Felt-Tip na situação 2. (▲) amostras Felt-Tip na situação 1 impressora laser. (▲) amostras Felt-Tip na situação 2 impressora a laser. (----) Threshold.

Referências

Documentos relacionados

Esta é uma vantagem que pode influenciar a produtividade das empresas, pois, para além de ser cada vez mais importante adotar métodos mais fáceis de comunicação entre os

• The definition of the concept of the project’s area of indirect influence should consider the area affected by changes in economic, social and environmental dynamics induced

Dois sítios ativos operam simultaneamente na superfície dos catalisadores de ferro: a fase ativa para a síntese de Fischer-Tropsch parece ser a fase carbeto de ferro,

Nada mais natural, portanto, que haja, na LA, um diálogo de diferentes vozes, diferentes teorias, diferentes campos, para a captação dessa complexidade. Assim, o

Devido ao relevo e à localização da região, no Centro-Oeste nascem importantes rios que alimentam outras áreas do país, como alguns estados do Sul e do Norte do

O estado do Rio de Janeiro possuía grandes cassinos, como o do Copacabana Palace, considerado o primeiro hotel-cassino do país, o Cassino da Urca, o Atlântico, o Icaraí, na cidade

We identified climatically stable areas of seasonally dry forests (SDFs) from Central Brazil through time and assessed the effectiveness of the current reserves network in

Penso em encantamento como “a irrupção da dimensão mágica numa sociedade regida pela racionalidade e cujas imagens de mundo são sistemáticas e racionalizadas”; a emergência