• Nenhum resultado encontrado

Aplicações bioanalíticas da espectroscopia Raman intensificada por superfície utilizando papel como substrato

N/A
N/A
Protected

Academic year: 2021

Share "Aplicações bioanalíticas da espectroscopia Raman intensificada por superfície utilizando papel como substrato"

Copied!
131
0
0

Texto

(1)

JAVIER ERICK LOBATÓN VILLA

“APLICAÇÕES BIOANALÍTICAS DA ESPECTROSCOPIA RAMAN

INTENSIFICADA POR SUPERFÍCIE UTILIZANDO PAPEL COMO

SUBSTRATO”

Campinas

2018

(2)

“APLICAÇÕES BIOANALÍTICAS DA ESPECTROSCOPIA RAMAN

INTENSIFICADA POR SUPERFÍCIE UTILIZANDO PAPEL COMO

SUBSTRATO”

Tese de Doutorado apresentada ao Instituto de Química da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Doutor em Ciências

Orientador: Prof. Dr. Ronei Jesus Poppi

ESTE EXEMPLAR CORRESPONDE À VERSÃO FINAL DA TESE DEFENDIDA PELO ALUNO JAVIER ERICK LOBATÓN VILLA E ORIENTADO PELO PROF. DR. RONEI JESUS POPPI

CAMPINAS 2018

(3)
(4)
(5)
(6)

Agradeço ao Prof. Dr. Ronei por todo o ensinamento, paciência e atenção para o desenvolvimento satisfatório deste trabalho.

A meus amigos do LAQQA (Carol, Hery, Luciana Terra, Luciana Oliveira, Willian, Marina, Carlos Diego, Carlos Teixeira, Guto, Débora e Felipe), por tantos momentos de colaboração, descontração e interação.

Aos funcionários do Instituto de Química, principalmente ao Humberto por toda sua dedicação e empenho em ajudar sempre.

À UNICAMP e ao Instituto de Química por disponibilizarem a infraestrutura necessária para o desenvolvimento deste trabalho.

À minha mãe Edith e ao meu irmão Diego pelo seu apoio incondicional. Aos meus amigos Juliana, Suzi, Sonia, Dayanna, Cassia, Alfredo, Otto, Luis, Nicolas, João, Lourenço, Thiago, Paul e Marcelo que foram, com certeza, uma fonte constante de alegria.

Aos professores Dr. Celio Pasquini, Dr. Eduardo Coronado e Dr. Diego dos Santos pelas discussões e os ensinamentos durante a realização desta tese.

(7)

“APLICAÇÕES BIOANALÍTICAS DA ESPECTROSCOPIA RAMAN

INTENSIFICADA POR SUPERFICIE UTILIZANDO PAPEL COMO SUBSTRATO”

Neste trabalho, foram desenvolvidos métodos analíticos qualitativos e quantitativos utilizando espectroscopia Raman intensificada por superfície (SERS Surface-Enhanced Raman Spectroscopy) e papel como substrato para aplicações bioanalíticas. Foram realizadas quatro aplicações, sendo a primeira a discriminação de bactérias no nível de gêneros e espécies utilizando papel de filtro recoberto com nanopartículas de ouro (GNPs – Gold Nanoparticles) como substrato SERS e análise discriminante por mínimos quadrados parciais (PLS-DA – Partial Least Squares Discriminant Analysis) com estimativa de incerteza como método de classificação supervisionado. Em uma segunda aplicação, foi realizado o estudo da deposição direta de GNPs em papel de impressão visando desenvolver uma alternativa rápida ao procedimento convencional de imersão de papel de filtro em solução coloidal de GNPs. Esses substratos SERS foram utilizados para a determinação in situ de ácido úrico (em concentrações clinicamente relevantes) em urina sintética. Além disso, a resolução multivariada de curvas (MCR – Multivariate Curve Resolution), acomplada com o método de adição de padrão, foi utilizada para resolver bandas sobrepostas e compensar o efeito de matriz. Devido ao procedimento de amostragem pouco eficiente quando utilizado papel como substrato em SERS, em uma terceira aplicação, a técnica de ring oven (ROP – Ring Oven Preconcentration) foi proposta para a pré-concentração rápida e eficiente de amostra em papel de filtro. Para tal, três métodos de acoplamento ROP-SERS foram avaliados utilizando cristal violeta como analito. O melhor método de acoplamento foi aplicado na quantificação de bases purínicas (adenina e guanina) em uma amostra de DNA de bezerro utilizando o método de adição de padrão e padrões internos. Por fim, a determinação de concentrações fisiologicamente relevantes de adenosina, um potencial biomarcador de câncer na urina, foi feita utilizando a técnica ROP-SERS. Nesta aplicação, o MCR foi utilizado para resolver as bandas sobrepostas de adenosina e da matriz de urina.

(8)

“BIOANALYTICAL APPLICATIONS OF SURFACE-ENHANCED RAMAN SPECTROSCOPY USING PAPER AS SUBSTRATE”

In this work, qualitative and quantitative analytical methods were developed by using surface-enhanced Raman spectroscopy (SERS) and paper as substrate for bioanalytical applications. Four applications were performed, being the first one the discrimination of bacteria at the genus and species levels utilizing gold nanoparticle (GNP)-coated filter paper as SERS substrate and partial least squares discriminant analysis (PLS-DA) with uncertainty estimation as supervised classification method. In the second application, the direct deposition of colloidal GNPs on printing paper was investigated as a rapid alternative to the conventional dip-coating of filter paper in a colloidal GNPs solution. These SERS substrates were used for the in situ quantification of uric acid, at clinically relevant concentrations, in synthetic urine. Further, multivariate curve resolution (MCR) coupled with the standard addition method was used to resolve overlapping bands and to compensate for the matrix effect. Due to the inefficient sampling process when employing paper-based SERS substrates, in a third application, the ring oven technique was proposed for the rapid and efficient preconcentration of the samples on filter paper. Thus, three different methods for coupling ring oven preconcentration (ROP) and SERS were assessed, using crystal violet as analyte. The best coupling method was utilized for the determination of purine bases (adenine and guanine) in calf thymus DNA by the standard addition method and using one analyte as an internal standard of the other. Finally, the determination of physiologically relevant concentrations of adenosine, a potential cancer biomarker, in urine was performed using the ROP-SERS technique. In this application, MCR was used to resolve the overlapping bands of adenosine and urine matrix.

(9)

Figura 1: Espalhamento da radiação eletromagnética após sua incidência sobre uma amostra... 21 Figura 2: Representação ilustrativa do efeito SERS através (A) do modelo eletromagnético e (B) do modelo químico... 27 Figura 3: (A) Intensificação do campo elétrico em nanopartículas com diferentes formas. (B) Representação de um hot spot originado na junção de duas nanopartículas esféricas... 29 Figura 4: Substratos SERS rígidos altamente regulares (incluindo o substrato comercial Klarite®) fabricados por técnicas litográficas... 31 Figura 5: Representação do arranjo de dados espectroscópicos em quimiometria... 35 Figura 6: Representação esquemática da PCA para n componentes principais... 36 Figura 7: Representação espacial dos valores de T2 de Hotelling e resíduos

Q para a identificação de amostras anômalas... 37 Figura 8: Processo de separação de amostras de calibração e validação na validação cruzada... 40 Figura 9: Representação esquemática (A) do modelo MCR-ALS acoplado com o método de adição de padrão e (B) do modelo MCR-ALS com restrição de correlação... 45 Figura 10: Funções das bactérias no ciclo do nitrogênio... 48 Figura 11: Caracterização das GNPs sintetizadas. (a) Imagem FESEM, (b) espectro UV-visível e (c) histograma da distribuição de tamanho de partícula... 54 Figura 12: Caracterização dos substratos SERS baseados em papel de filtro. (A) Foto do substrato e imagens FESEM (B) antes e (C) depois da deposição das bactérias... 55 Figura 13: (A) Espectros SERS das bactérias analisadas neste trabalho (N=190). (B) Espectros SERS dos produtos de degradação de purinas... 56 Figura 14: Modelos PLS-DA para a discriminação de bactérias dos gêneros

(10)

espécies (A) Gordonia rizhosphera e bronchialis, (B) Microbacterium homiis e xylanilyticum e (C) Brevibacterium linens e iodinum... 59 Figura 16: Escores VIP calculados para os modelos PLS-DA na discriminação de bactérias das espécies (A) Gordonia, (B) Microbacterium e (C) Brevibacterium... 61 Figura 17: Gráfico para a identificação de amostras anômalas (outliers) na análise de uma potencial nova espécie de bactéria (BreS) ... 64 Figura 18: Procedimento para o preparo de substratos SERS baseados em papel de impressão... 70 Figura 19: Efeito da quantidade de GNPs depositadas no papel de impressão (A) no sinal SERS e (B) no sinal de fundo... 74 Figura 20: Estudos FESEM dos substratos SERS baseados em papel de impressão preparados pela deposição da solução coloidal de GNPs (A) diluída três vezes, (B) sem diluição, (C) concentrada 10 vezes e (D) pré-concentrada 50 vezes... 76 Figura 21: Propriedades ópticas dos substratos SERS obtidos pela deposição de GNPs (A) em diferentes níveis de concentração. (B) Comparação dos espectros UV-visível do substrato SERS fabricado usando GNPs pré-concentradas 50 vezes e filmes de ouro depositados em papel e alumina... 77 Figura 22: Efeito do número de camadas de GNPs no fator de intensificação prevista pelo modelo teórico... 78 Figura 23: Comparação da repetibilidade nas medidas SERS utilizando substratos SERS baseados em papel de impressão e substrato SERS comerciais Klarite®... 79 Figura 24: (a) Espectros SERS de ácido úrico em água deionizada e urina sintética (US). (b) Espectros SERS da urina sintética (US) na presença de ácido úrico adicionado em diferentes níveis de concentração... 80 Figura 25: Espectro SERS de ácido úrico em solução aquosa, na ausência de interferentes, e o recupero pelo modelo MCR-ALS... 82 Figura 26: (a) Identificação da faixa linear de trabalho e (b) curva de adição

(11)

adenina (A), guanina (G), citosina (C) e timina (T)... 88 Figura 28: Componentes do sistema de pré-concentração baseado na técnica de ring oven... 89 Figura 29: (A) Espectro SERS de cristal violeta (1 µmol/L) obtido no substrato SERS de papel após a síntese in situ de GNPs. (B) Efeito da proporção citrato de sódio/ácido tetracloroáurico na resposta SERS com a massa de ácido tetracloroáurico fixa em 0,1 µg. (C) Efeitos das massas individuais de citrato de sódio e ácido tetracloroáurico na resposta SERS com a proporção de citrato de sódio/ácido tetracloroáurico fixa em 5000... 93 Figura 30: (A) Anel de GNPs obtido por meio do método in situ de redução com citrato proposta. (B) Imagem FESEM da borda do anel de GNPs formado. (C) Espectro (a) Raman na região interna do anel e (b) SERS antes e (c) após a adsorção de cristal violeta via imersão simples por 30 min... 94 Figura 31: (A) Anel de cristal violeta formado após a pré-concentração por ring oven. (B) Imagem FESEM no ponto p do anel. (C) Imagem SERS ao redor do ponto p do anel... 95 Figura 32: Efeito do volume de amostra injetado no sistema ROP na resposta SERS do cristal violeta... 97 Figura 33: Estudo do efeito do pH nos espectros SERS de A (10 µmol/L), G (10 µmol/L), C (10 µmol/L) e T (50 µmol/L), obtidos em pH (A) 13, (B) 6 e (C) 1... 199 Figura 34: Estudo do efeito do pH nos espectros SERS de A (10 µmol/L), G (10 µmol/L), C (10 µmol/L) e T (50 µmol/L), obtidos em pH (A) 13, (B) 6 e (C) 1... 100 Figura 35: Efeito do pH no sinal SERS de DNA de bezerro desnaturado... 101 Figura 36: (A) Espectros SERS de DNA desnaturado obtido em diferentes concentrações. (B) Determinação de A em DNA usando G como padrão interno. (C) Determinação de G em DNA usando A como padrão interno... 103 Figura 37: Tipos de câncer mais comuns em homens e mulheres. O número de casos mostrados corresponde ao ano 2016 e foram obtidos do 106

(12)

por um sistema de injeção em fluxo à esquerda (bomba peristáltica, controlador de fluxo, injetor e recipiente de descarte) e um forno à direita (sistema ring oven)... 109 Figura 39: (A) Caracterização do anel de adenosina (1 µmol/L) formado após a pre-concentração por ring oven. (B) Estudo da influência do pH no espectro SERS de adenosina. (C) Identificação da faixa linear para a detecção de adenosina em pH 1... 111 Figura 40: Comparação dos espectros SERS de urina humana sintética e real em meio ácido e meio básico... 112 Figura 41: (A) Espectros recuperados e (B) capacidade de previsão do modelo MCR-ALS com restrição de correlação... 113 Figura 42: (A) Espectros recuperados e (B) curva de adição de padrão do modelo MCR-ALS sem restrição de correlação... 114 Figura 43: Espectros SERS de adenosina, guanosina, citidina, uridina e timidina obtidos após a pré-concentração por ring oven em pH (A) 1 e (B) 11... 116

(13)

LISTA DE TABELAS

Tabela 1: Comparação da secção eficaz observada em vários processos de interação da radiação eletromagnética com a matéria... 25 Tabela 2: Parâmetros de desempenho dos modelos PLS-DA para a discriminação de gêneros e espécies de bactérias... 62 Tabela 3: Comparação dos métodos de fabricação de substratos SERS baseados em papel... 67 Tabela 4: Figuras de mérito do método SERS/MCR-ALS proposto... 83 Tabela 5: Comparação do desempenho do método convencional e dos métodos propostos após a pré-concentração de 300 µL de cristal violeta (1 µmol/L). ... 96 Tabela 6: Ensaios de adição e recuperação na determinação de adenosina em amostras de urina de três pessoas saudáveis (U1, U2 e U3). ... 115

(14)

LISTA DE ABREVIATURAS

Abreviatura Descrição em Inglês Descrição em Português

SERS Surface-Enhanced Raman Spectroscopy/Scattering Espectroscopia/Espalhamento Raman intensificada/intensificado por superfície SERRS Surface-Enhanced Resonance Raman Spectroscopy

Espectroscopia Raman ressonante intensificada por superfície

MCR Multivariate Curve Resolution Resolução multivariada de curvas

GNPs Gold NanoParticles Nanopartículas de ouro

ROP Ring Oven Preconcentration Pré-concentração por ring oven

NIR Near InfraRed Infravermelho próximo

PCA Principal Component

Analysis Análise de componentes principais

PLSR Partial Least Squares regression

Regressão por mínimos quadrados parciais

PLS-DA Partial Least Squares discriminat analysis

Análise discriminante por mínimos quadrados parciais

LOD Limit of Detection Limite de detecção

LOQ Limit of Quanfication Limite de quantificação

MCR-ALS

Multivariate Curve Resolution-Alternating Least

Squares

Resolução Multivariada de curvas com mínimos quadrados alternantes

SVD Singular Value

Decomposition Decomposição em valores singulares

RMSECV Root Mean Square Error of Cross Validation

Raiz quadrada do erro médio quadrático de validação cruzada

RMSEC Root Mean Square Error of Calibration

Raiz quadrada do erro médio quadrático de calibração

SIMPLISMA SIMPLe-to-use InteractiveS Mixture Analysis

Análise de mistura iterativa fácil de usar

(15)

EFA Envolving Factor Analysis Análise envolvente de fatores

DNA DeoxyriboNucleic Acid Ácido desoxirribonucleico

(16)

SUMÁRIO

Capítulo 1 – Introdução... 18

1.1 Química Bioanalítica... 19

1.2 Espectroscopia Raman... 19

1.3 Espectroscopia Raman intensificada por superfície (SERS)... 26

1.3.1 Substrato... 28

1.3.2 Analito... 32

1.3.3 Matriz... 33

1.4 Quimiometria... 34

1.4.1 Análise de componentes principais (PCA)... 36

1.4.2 Análise discriminante por mínimos quadrados parciais (PLS-DA).... 38

1.4.3 Resolução multivariada de curvas (MCR-ALS)... 42

1.5 Objetivos gerais... 45

Capítulo 2 – Discriminação de gêneros e espécies de bactérias empregando uma plataforma SERS de papel de filtro e PLS-DA... 47

2.1 Motivação... 2.2 Objetivos específicos... 48 50 2.3. Parte experimental... 50 2.4 Resultados e discussão... 53 2.5 Conclusões parciais... 64

Capítulo 3 – Determinação in situ de ácido úrico utilizando substratos SERS baseados em papel de impressão e MCR-ALS... 66

3.1 Motivação... 67

3.2 Objetivos específicos ... 69

3.3 Parte experimental... 69

3.4 Resultados e discussão... 72

3.5 Conclusões parciais ... 84

Capítulo 4 – Acoplamento da técnica de ring oven e SERS (ROP-SERS): Monitoramento de bases purínicas em DNA... 85

4.1 Motivação... 86

(17)

4.3 Parte experimental... 88

4.4 Resultados e discussão... 91

4.5 Conclusões parciais... 104

Capítulo 5 – Quantificação seletiva de adenosina em urina usando ROP-SERS e MCR-ALS... 105 5.1 Motivação... 106 5.2 Objetivos específicos... 107 5.3 Parte experimental... 108 5.4 Resultados e discussão... 109 5.5 Conclusões parciais... 116

Capítulo 6 – Conclusões e perspectivas... 117

(18)

CAPÍTULO 1

(19)

1.1 Química bioanalítica

Após um século da história da humanidade de grandes avanços em medicina, tem-se uma crise global de saúde, que afeta principalmente os países em desenvolvimento. Esta crise de saúde pública não está apenas relacionada com a presença de parasitas exóticos, bactérias ou vírus, que têm sido o centro das atenções por muitos anos, mas também com doenças cardiovasculares, câncer, diabetes, etc. Neste sentido, de acordo com a previsão de número de mortes prematuras (i.e., de pessoas com uma idade inferior aos 60 anos) em países em desenvolvimento, existe um aumento alarmante do número de vítimas na próxima década [1,2]. Assim, esforços importantes no diagnóstico precoce destas doenças vêm sendo desenvolvidos com o intuito de mudar esse panorama desfavorável.

Neste contexto, a química bioanalítica tem ganhado grande interesse, pois tem como objetivo o desenvolvimento de métodos analíticos aplicáveis nas áreas da análise clínica, toxicológica e forense. Como resultado, métodos analíticos cada vez mais baratos, rápidos e eficientes na prevenção e no diagnóstico de doenças vêm sendo desenvolvidos. Esses métodos utilizam, em muitos casos, técnicas como a cromatografia, eletroforese, espectrometria de massas ou espectroscopia vibracional. Dentre essas técnicas, as espectroscopias vibracionais (infravermelho e Raman) se destacam devido ao mínimo preparo de amostra requerido e à sua portabilidade e versatilidade [3–5]. Entretanto, a espectroscopia do infravermelho está limitada pela grande quantidade de água usualmente presente em amostras biológicas, o que resulta em sinais interferentes que dificultam a interpretação espectral. Em contraste, a espectroscopia Raman apresenta-se como uma excelente alternativa para analisar este tipo de amostras devido à facilidade para se trabalhar em meio aquoso sem interferência espectral significativa.

1.2 Espectroscopia Raman

Dentre os fenômenos que podem ser observados como resultado da interação da luz com a matéria, dois tipos de espalhamento podem ser mencionados: o efeito Tyndall e o espalhamento Rayleigh. No efeito Tyndall, o espalhamento de luz é originado por partículas como, por exemplo, de fumaça ou de

(20)

névoa. No espalhamento Rayleigh, por outro lado, são as moléculas as responsáveis pelo espalhamento da luz. Em ambos os casos, nenhuma mudança na energia da radiação eletromagnética é observada, ou seja, o espalhamento da radiação é elástico. Entretanto, em 1928, Chandrasekhra Venkata Raman descobriu experimentalmente outro tipo de espalhamento, o espalhamento inelástico da radiação, também conhecido como espalhamento/efeito Raman [6]. Devido ao fato do o espalhamento Raman já ter sido anteriormente previsto teoricamente por Smekal em 1923, muitas vezes esse fenômeno é citado como espalhamento/efeito Smekal-Raman. Apesar da instrumentação limitada da época, C. V. Raman realizou o experimento com sucesso utilizando apenas luz solar como fonte, um telescópio como coletor e seus olhos como detectores. Além disso, o fato do espalhamento inelástico da radiação ser um fenômeno pouco provável (pouco sensível) fez com que o mérito do seu descobrimento fosse reconhecido mundialmente, tendo sido agraciado com o prêmio Nobel de Física em 1930 [6].

Um esquema ilustrativo com os possíveis tipos de espalhamento da radiação eletromagnética é apresentado na Figura 1. Quando a radiação incidente interage com a molécula pode, momentaneamente, atingir um nível energético maior e instável. Esse nível energético instável é também conhecido como estado energético virtual. Depois disso, a molécula perde energia rapidamente e volta ao estado vibracional fundamental emitindo um fóton. Nesse momento, uma pequena parte das moléculas no estado energético virtual também pode relaxar e voltar a um estado energético vibracional diferente do fundamental [6,7]. Assim, o espalhamento da radiação pelas moléculas pode acontecer de três maneiras diferentes: (1) espalhamento Rayleigh ou elástico, quando a frequência da radiação incidente νi é

igual à frequência da radiação espalhada νe. (2) Espalhamento Raman Stokes, quando νi é maior que νe. (3) Espalhamento Raman anti-Stokes, quando νi é menor que νe. Além disso, em temperaturas convencionais de trabalho (temperatura

ambiente ~25 ºC) existem mais moléculas no nível energético vibracional fundamental do que no excitado e, portanto, o espalhamento Raman Stokes torna-se mais provável (sinal mais intenso). Por este motivo, o espalhamento Raman Stokes é o mais utilizado em aplicações analíticas.

(21)

Figura 1: Espalhamento da radiação eletromagnética após sua incidência sobre uma amostra.

O espalhamento Raman pode ser descrito nas formas clássica e quântica. Nesta tese, entretanto, abordaremos principalmente a descrição clássica do fenômeno [6,7]: os elétrons e prótons de uma molécula dentro de um campo elétrico de radiação eletromagnética experimentam forças eletrostáticas em diferentes direções. Como consequência, a molécula é polarizada, gerando um momento de dipolo induzido. A polarizabilidade da molécula (α) pode ser estimada como o momento de dipolo induzido (P) dividido pela magnitude do campo elétrico (E) responsável pelo momento de dipolo induzido (equação 1).

P = αE (1)

A polarizabilidade pode ser interpretada então como a capacidade da molécula para deformar sua nuvem eletrônica na presença de um campo elétrico.

(22)

Com relação ao campo elétrico, a sua magnitude nas vizinhanças das moléculas varia segundo:

E = E0cos2πνt (2)

onde E0 é uma constante (valor máximo do campo elétrico), ν é a frequência, e t é o tempo. Esse campo elétrico oscilante induz na molécula um momento de dipolo oscilante P, cuja frequência é idêntica à do campo elétrico incidente. Então, usando as Equações 1 e 2, o momento de dipolo induzido pode ser expresso como:

P = αE0cos2πνt (3)

Considerando que certas vibrações e rotações moleculares podem causar uma mudança na polarizabilidade da molécula, esta deve ser considerada como tendo um valor variável. Por exemplo, uma molécula diatômica apresenta valores diferentes de polarizabilidade quando a ligação é comprimida e estendida. Assim, para pequenos deslocamentos, a polarizabilidade pode ser expressa por uma série de Taylor: α = α0+ ( ∂α ∂Q)0Q + ( ∂2α ∂Q2) 0Q 2+ ⋯ (4)

onde α0 é a polarizabilidade na posição de equilíbrio, Q é a coordenada com relação à posição de equilíbrio, e a derivada da polarizabilidade é a taxa de mudança da polarizabilidade com relação a Q. Considerando que Q também varia periodicamente com o tempo, seu valor pode ser expresso como:

Q = Q0cos2πνvt (5)

onde Q0 é uma constante (valor de Q na posição de equilíbrio) e νv é a frequência normal de vibração da molécula. Segundo a aproximação harmônica, os termos de maior ordem da equação 4 podem ser negligenciados e então, combinando as equações 4 e 5 tem-se que:

(23)

α = α0+ (∂α

∂Q)0Q0cos2πνvt (6)

Esse valor de α na equação 6 pode ser utilizado na equação 1 para obter a equação 7 e, após utilizar uma identidade trigonométrica, obtém-se a equação 8.

P = α0E0cos2πνt + (∂α ∂Q)0Q0E0cos⁡(2πνvt)cos⁡(2πνt) (7) P = α0E0cos2πνt + (∂α ∂Q)0 Q0E0 2 cos 2π(ν − νv)t + ( ∂α ∂Q)0 Q0E0 2 cos 2π(ν + νv)t (8)

Pode-se concluir então que o momento de dipolo induzido pode variar em três frequências diferentes ν, ν − νv e ν + νv, originando os espalhamentos Rayleigh, Stokes e anti-Stokes, respectivamente. Outra observação importante é que, se o valor da derivada da polarizabilidade é igual a zero, o segundo e o terceiro termo da equação 8 são nulos e a radiação é então espalhada apenas de forma elástica (espalhamento Rayleigh). Portanto, para que um tipo de vibração molecular apresente sinal no espectro Raman, essa vibração tem que ser acompanhada por uma mudança na polarizabilidade da molécula.

Também, a proporção das intensidades Raman Stokes e anti-Stokes da radiação espalhada pode ser estimada através da distribuição de função de Boltzmann, obtendo a seguinte expressão:

Ianti−Stokes IStokes

=

(ν+νv)4 (ν−νv)4

e

−hνv kT (9)

Em temperaturas próximas à temperatura ambiente (usando 25 ºC como referência) a população do estado excitado que origina as bandas anti-Stokes é muito menor que a população no estado fundamental. Em consequência disto, as bandas Raman Stokes são mais intensas que as anti-Stokes, e são utilizadas com maior frequência em aplicações analíticas da espectroscopia Raman [6,7].

Adicionalmente, as intensidades Raman (Stokes e anti-Stokes) dependem das características do equipamento usado, da quarta frequência da radiação

(24)

espalhada, da intensidade da radiação excitante (E), do número de espalhadores (N) e da taxa de mudança da polarizabilidade (∂α

∂Q), conforme mostrado na equação 9.

IRaman ∝ (ν ± νv)4× E

02× N × ∂α

∂Q (10)

O espectro Raman pode ser interpretado como um gráfico da intensidade do espalhamento inelástico como função da diferença energética entre o fóton incidente e espalhado (frequência vibracional). Neste sentido, a espectroscopia Raman proporciona informação química e estrutural das moléculas, tornando-a uma ferramenta poderosa para caracterizar uma ampla variedade de substâncias. Por exemplo, no grafeno, informação específica sobre o número de camadas e a orientação das mesmas neste material pode ser obtida através da avaliação do espectro Raman [8]. O estudo de formas polimórficas de princípios ativos de fármacos ou de alimentos também pode ser feito através desta técnica, como demonstrado por Gu et al. [9] e Bueno et al. [10], respectivamente. Devido ao mínimo preparo de amostra requerido, a espectroscopia Raman tem sido utilizada em uma ampla variedade de aplicações analíticas, tais como identificação de adulterantes em leite [11], controle de qualidade de combustíveis [12], autenticação de óleos vegetais [13], determinação da composição química de fármacos [14], discriminação de tecidos cancerígenos [15], etc. Adicionalmente, o desenvolvimento recente de espectrômetros Raman portáteis introduziu a possibilidade de realizar essas análises in situ com resultados satisfatórios [16–18].

Apesar de ter sido utilizada com sucesso em diversas aplicações analíticas, a espectroscopia Raman apresenta duas limitações importantes: (i) a baixa sensibilidade como resultado da baixa secção eficaz e (ii) a interferência espectral causada pela fluorescência das amostras. A secção eficaz (σ) é um valor, expresso em unidades de área, que descreve a eficiência de processos de interação da radiação eletromagnética com a matéria, tais como absorção, emissão ou espalhamento [19]. Em particular, no espalhamento Raman, a secção eficaz pode ser entendida como a proporção da intensidade da radiação espalhada inelasticamente dividida pela potência da radiação incidente. Neste sentido, como o espalhamento Raman apresenta um valor de secção eficaz baixo, existe uma baixa

(25)

probabilidade de o fenômeno acontecer e, consequentemente, uma baixa sensibilidade [19]. Por este motivo, as aplicações da espectroscopia Raman são usualmente restritas à detecção de analitos em concentrações relativamente altas (na ordem de 1% em massa ou maiores). Na Tabela 1 é mostrada uma comparação entre as secções eficazes comumente observadas em vários processos incluindo o espalhamento Raman.

Tabela 1. Comparação da secção eficaz observada em vários processos de interação da radiação eletromagnética com a matéria. Tabela adaptada da referência [19].

Processo Secção eficaz (σ, cm2)

Espalhamento Raman 10-29

Espalhamento Rayleigh 10-26

Espalhamento Raman ressonante 10-24

Absorção no infravermelho 10-21

Emissão de fluorescência 10-19

Absorção no ultravioleta-visível 10-18

Espalhamento Raman intensificado por superfície 10-16

Além da baixa secção eficaz, a fluorescência da matriz da amostra pode limitar o uso da espectroscopia Raman, pois pode originar bandas intensas e largas e dificultar a observação das bandas Raman [20]. Este tipo de interferência torna-se crítica quando a frequência da radiação incidente é muito energética (e.g. na região próxima do ultravioleta) e quando a matriz da amostra é rica em compostos fluorescentes. Por este motivo, o desenvolvimento de métodos bioanalíticos empregando espectroscopia Raman pode tornar-se uma tarefa complexa.

Com o intuito de compensar as limitações anteriormente mencionadas, o efeito de espalhamento Raman ressonante tem sido utilizado. Este fenômeno consiste no uso de radiação excitante com uma energia próxima da energia necessária para uma transição eletrônica da molécula alvo (analito) [21]. Os exemplos clássicos de analitos detectados por essa técnica são os corantes (e.g. cristal violeta, verde de malaquita, etc.), pois apresentam absorção no espectro visível, o que é compatível com os lasers utilizados em muitos dos equipamentos

(26)

Raman convencionais. Como pode ser observado na Tabela 1, isto resulta em um aumento de aproximadamente 5 ordens de grandeza na secção eficaz. No entanto, a maior limitação do efeito de espalhamento Raman ressonante é que está restrito a um número reduzido de analitos cromóforos, pois a frequência de transição eletrônica deve ser próxima à frequência da radiação excitante (comumente na região do UV-visível em equipamentos Raman convencionais).

Neste contexto, a espectroscopia Raman intensificada por superfície apresenta-se como uma alternativa interessante para compensar as limitações da espectroscopia Raman convencional.

1.3 Espectroscopia Raman intensificada por superfície (SERS)

A espectroscopia Raman intensificada por superfície ou efeito de espalhamento Raman intensificado por superfície (SERS – Surface-Enhanced Raman Spectroscopy/Scattering) foi observada pela primeira vez por Fleischmann et al., em 1974 [22]. Neste experimento, foi utilizado um eletrodo rugoso de prata para obter o espectro Raman eletroquímico (espectroscopia Raman + eletroquímica) de piridina, observando intensidades maiores que as esperadas. Em um primeiro momento, essa intensificação foi atribuída ao aumento da área superficial devido à alta rugosidade do eletrodo. Porém, a intensificação observada continuava sendo muito maior que a esperada considerando-se o aumento na área superficial. Três anos mais tarde (1977), os trabalhos independentemente publicados por Jeanmaire e Van Duyne [23] e Albretch e Creighton [24] conseguiram explicar corretamente a origem deste fenômeno. Os pesquisadores demonstraram que, a intensificação do sinal Raman é originada pela interação da radiação eletromagnética com a superfície metálica rugosa, o que incrementa drasticamente a magnitude do campo elétrico nas proximidades da superfície.

Atualmente, existem dois modelos utilizados para explicar a origem da intensificação do sinal no efeito SERS: (i) o modelo eletromagnético [25,26] e (ii) o modelo químico [27,28]. O modelo eletromagnético leva em consideração a resposta óptica do metal em relação ao campo elétrico da radiação excitante. Assim, em princípio, este modelo não está relacionado às características do analito. Como mostrado na Figura 2A, a radiação excitante induz a oscilação da nuvem eletrônica

(27)

da superfície metálica rugosa ou nanoestruturada (substrato SERS) com uma frequência determinada, originando o chamado plasmon de superfície. Isto significa que existe uma condição de ressonância entre a frequência de oscilação do plasmon de superfície e a frequência da radiação excitante. Essa condição de ressonância depende principalmente do tipo de metal e da arquitetura do substrato SERS (por exemplo, a forma e o tamanho da nanoestrutura) e é conhecida como ressonância de plasmon de superfície. Desta forma, na condição de ressonância, a superfície do substrato SERS atua como uma ‘‘antena’’, concentrando o campo elétrico local nas proximidades da superfície metálica e, consequentemente, intensificando o sinal Raman das moléculas próximas da superfície. Desde que os lasers comumente utilizados nos equipamentos Raman geram radiação excitante na região do visível ou do infravermelho próximo, os metais com melhor resposta óptica são aqueles que são bons espalhadores de radiação e que, ao mesmo tempo, absorvem uma proporção mínima da radiação nesta região. O ouro, a prata e o cobre são os metais que apresentam essas características e, por este motivo, são os metais mais utilizados em SERS.

Figura 2: Representação ilustrativa do efeito SERS através (A) do modelo eletromagnético e (B) do modelo químico. Figura adaptada da referência [29].

(28)

Por outro lado, o modelo químico leva em consideração a geração de novos estados energéticos da molécula devido à sua quimissorção na superfície metálica formando um complexo (Figura 2B). A formação deste complexo permite a transferência de densidade de carga entre a molécula e o metal causando alterações na polarizabilidade da molécula e, consequentemente, a intensificação do sinal Raman. Neste ponto, é importante mencionar que a contribuição do modelo químico à intensificação global do sinal Raman é normalmente várias ordens de grandeza menor que a contribuição do modelo eletromagnético.

Além da intensificação do sinal Raman, em muitos casos, o efeito SERS pode suprimir o sinal de fluorescência das amostras quando o analito é adsorvido na nanosuperfície. Isto é devido à possibilidade de transferência energética molécula-metal através de processos de emissão não radioativos. Em consequência, a fluorescência é suprimida com relação às intensidades das bandas Raman, apesar do sinal da fluorescência também poder ser intensificado (em uma magnitude muito menor que o sinal Raman) [25]. Neste sentido, como resultado da sua alta sensibilidade e da sua capacidade para suprimir a fluorescência, SERS tornou-se uma ferramenta valiosa na análise de amostras biológicas [30]. Entretanto, considerações importantes com relação ao substrato, ao analito e à matriz da amostra têm que ser feitas para o desenvolvimento de métodos bioanalíticos confiáveis empregando SERS.

1.3.1 Substrato

A escolha do substrato SERS a ser utilizado é uma etapa fundamental no desenvolvimento de métodos analíticos qualitativos e quantitativos. Idealmente, um substrato SERS deve proporcionar uma grande intensificação do sinal Raman, de forma reprodutível, e, ao mesmo tempo, ser quimicamente estável [31]. Entretanto, na prática, alguma destas características pode ser priorizada dependendo do tipo de aplicação em que o substrato será utilizado.

De forma geral, os substratos SERS podem ser classificados como substratos SERS coloidais e substratos SERS sólidos. Os substratos SERS coloidais ou coloides de nanopartículas têm sido amplamente utilizados para o estudo do efeito SERS em si. Como a água possui uma baixa polarizabilidade, soluções aquosas são amplamente utilizadas em SERS sem interferência espectral. Como mencionado

(29)

anteriormente, para maximizar a intensificação do sinal Raman, a frequência do plasmon de superfície deve ser igual ou próxima à frequência da radiação excitante. Considerando que a frequência do plasmon de superfície é altamente dependente da arquitetura do substrato SERS [32], a síntese de coloides com uma resposta ótica favorável tem sido amplamente investigada. Assim, como mostrado na Figura 3A, nanopartículas coloidais com diversas formas (esferas, cubos, estrelas, flores, bastões, triângulos, etc.) e tamanhos podem ser utilizadas como substratos SERS [33]. Desta maneira, a condição de ressonância de plasmon de superfície pode ser compatibilizada com o uso de diversos tipos de lasers Raman (excitados em 533, 633, 785 ou 1024 nm, por exemplo). Neste ponto, é importante considerar também a possibilidade da geração de regiões com intensificação de campo elétrico extremamente grande (chamados ‘‘hot spots’’), que podem contribuir drasticamente na intensificação do sinal Raman [34] (Figura 3B). Por exemplo, nanopartículas de ouro esféricas com um plasmon de superfície localizado em 532 nm podem se aglomerar formando pequenos ‘‘clusters’’ e gerar um sinal muito intenso, mesmo utilizando um laser excitado em 785 nm, como resultado do acoplamento dos plasmons de superfície individuais e, consequentemente, o deslocamento da condição de ressonância para comprimentos de onda maiores. Essa intensificação pode ser alcançada através da adição de pequenas concentrações de sal (por exemplo, cloreto de sódio para nanopartículas com carga superficial positiva/negativa) ou pela ação do próprio analito, promovendo a formação de clusters de nanopartículas.

Figura 3: (A) Intensificação do campo elétrico em nanopartículas com diferentes formas. (B) Representação de um hot spot originado na junção de duas nanopartículas esféricas. Figura adaptada da referência [35].

(30)

Apesar da sua praticidade, o uso de substratos SERS coloidais em aplicações analíticas está limitado pela baixa repetibilidade, devido à possibilidade de coagulação (i.e. formação incontrolada ou precipitação de clusters de grande tamanho), e pela dificuldade para trabalhar em meio não aquoso. Uma alternativa para contornar essas limitações é, por exemplo, a deposição das nanopartículas em substratos sólidos quimicamente modificados (ou com elevada afinidade pelas nanopartículas utilizadas). Isto é, a conversão de substratos SERS coloidais em substratos SERS sólidos [31].

Os substratos SERS sólidos podem ser subclassificados como substratos SERS rígidos e substratos SERS flexíveis. Devido ao rápido avanço da nanotecnologia nas últimas duas décadas, a fabricação de substratos SERS rígidos altamente regulares (Figura 4), ou seja, com distribuição homogênea de hot spots, e com diversas arquiteturas pode ser feita empregando técnicas litográficas [36,37]. Esses métodos de fabricação possibilitam a obtenção de substratos SERS que proporcionam uma alta intensificação do sinal e, ao mesmo tempo, uma excelente repetibilidade do sinal. No entanto, esses procedimentos podem ser demorados, requerem instrumentação sofisticada e são relativamente caros.

(31)

Figura 4: Substratos SERS rígidos altamente regulares (incluindo o substrato comercial Klarite®) fabricados por técnicas litográficas. Figura adaptada da referência [37].

De forma alternativa, os substratos flexíveis, tais como nanotubos de carbono, polímeros e papel, podem ser utilizados para a fabricação de substratos SERS através da deposição de nanopartículas metálicas na sua superfície [38]. Dentre os substratos flexíveis, o papel se destaca devido à combinação do baixo custo, fácil processabilidade e propriedades biodegradáveis. Levando isto em consideração, Ngo et al. publicaram um dos primeiros trabalhos sobre o preparo de substratos SERS flexíveis baseados em papel de filtro e nanopartículas esféricas de ouro [39]. A estratégia utilizada foi o método de imersão, no qual pedaços de papel de filtro com áreas similares foram imersos em soluções de coloide de ouro por 24 horas. Apesar da carga superficial negativa das nanopartículas de ouro e do papel de filtro (devido à presença dos grupos hidroxila da celulose), as nanopartículas foram eficientemente adsorvidas na superfície do papel através de forças de Van der Waals. Os substratos preparados foram utilizados para detectar 4-aminotiofenol em concentrações muito baixas, na ordem de nmol/L. A excelente sensibilidade do substrato foi atribuída à geração de hot spots em três dimensões (nas fibras do papel) e não apenas em duas, como observado nos substratos SERS rígidos.

(32)

Neste ponto, é lógico pensar que a irregularidade da superfície do papel pode prejudicar a repetibilidade das medidas, quando comparada à obtida usando substratos SERS rígidos. Contudo, apesar da quantificação de analitos em amostras com matrizes complexas empregando substratos SERS baseados em papel ainda ser rara, alguns trabalhos publicados na última década têm demonstrado que os substratos SERS baseados em papel podem proporcionar precisões adequadas para várias aplicações analíticas. Essas aplicações incluem, por exemplo, a detecção de pesticidas em casca de frutas [40], a determinação de glicose no sangue [41], a detecção de corantes em bebidas [42], a quantificação de nicotinamida em cosméticos [43] e a classificação de micro-organismos [44]. O papel apresenta-se, portanto, como substrato altamente promissor para a fabricação de substratos SERS de alto desempenho e baixo custo na análise qualitativa/quantitativa de amostras com matrizes complexas.

1.3.2 Analito

Em princípio, o espectro SERS de qualquer molécula pode ser obtido. Entretanto, o nível de intensificação necessário para que o espectro SERS seja observável, bem como as condições experimentais, podem mudar drasticamente de uma molécula para outra [45,46]. Em outras palavras, se uma molécula possui um sinal Raman, esse sinal pode ser intensificado através do efeito SERS. Porém, promover a adsorção do analito na superfície do substrato SERS pode tornar-se uma tarefa difícil dependendo das características do analito. Por exemplo, a glicose apresenta uma baixa afinidade por superfícies metálicas de ouro ou de prata, motivo pelo qual o seu espectro SERS é dificilmente obtido, mesmo em concentrações relativamente altas. Levando em consideração esse comportamento, Van Duyne e colaboradores modificaram a superfície dos substratos SERS rígidos de prata com ácido bisbórico, o que permitiu detectar glicose na presença de frutose em concentrações fisiologicamente relevantes (nível de mmol/L) [47]. De forma análoga, Ranc et al. modificaram a superfície de nanopartículas de prata com um complexo de ferro para detectar dopamina, um importante neurotransmissor, em fluídos biológicos [48]. Apesar d esses métodos mostrarem eficiência para promover a adsorção do analito na superfície metálica, a identificação e síntese de um agente de captura específico é uma tarefa relativamente complexa. A estratégia que será

(33)

utilizada para promover a adsorção do analito no substrato SERS é, portanto, uma etapa crítica no desenvolvimento de métodos analíticos. Neste contexto, um analito pode ser considerado como ‘bom’ se o seu espectro pode ser obtido com relativa facilidade e com um nível de intensificação elevado, mesmo em concentrações relativamente baixas. Alguns exemplos de analitos ‘bons’ são as moléculas com anéis benzênicos ligados a um grupo tiol (e.g. tiofenol) ou amino (e.g. 4-aminofenol) e os corantes (e.g. cristal violeta, rodamina e verde de malaquita). Particularmente, para os corantes, as diferenças entre seus níveis eletrônicos são similares à radiação excitante utilizada (usualmente na região do espectro visível), o que dá origem ao espalhamento Raman ressonante intensificado por superfície (SERRS – Surface-Enhanced Ressonance Raman Scattering). Por este motivo, os corantes têm sido popularmente utilizados para demonstrar a detecção ultrassensível no regime de uma única molécula [49–51]. Neste ponto é importante mencionar que as estratégias experimentais dever adequar-se não apenas ao tipo de analito, mas também à complexidade da matriz da amostra.

1.3.3 Matriz

Desde o descobrimento do efeito SERS, muitos trabalhos relacionados à detecção ultrassensível de moléculas, na ausência de interferentes, têm sido reportados. No entanto, a utilização de SERS na análise de amostras com matrizes complexas (e.g. amostras biológicas) implica a inclusão de uma grande quantidade de potenciais interferentes, usualmente presentes em concentrações maiores que às do analito [45]. Por exemplo, quantidades relativamente grandes de proteínas, ureia, creatinina e íons inorgânicos podem ser encontradas em fluidos biológicos, o que pode dificultar a detecção de ácido úrico devido à competição pela área ativa da nanosuperficie. Como consequência, uma curva analítica externa é raramente utilizada no desenvolvimento de métodos quantitativos sem a modificação de superfície do substrato SERS. Para compensar a falta de seletividade, o acoplamento de SERS com técnicas de separação cromatográficas tem sido proposto [52,53]. Apesar do melhoramento significativo da seletividade pela separação dos componentes da amostra, essa estratégia pode ser tediosa, complexa e demorada, e adiciona etapas adicionais ao método analítico. Entretanto, se a afinidade do analito pelo substrato SERS é grande o suficiente para superar a

(34)

interferência de alguns dos componentes da matriz, a sua determinação pode ser feita inclusive na presença de bandas sobrepostas através do uso de ferramentas quimiométricas.

1.4 Quimiometria

A quimiometria é o ramo da química que emprega ferramentas matemáticas e estatísticas para analisar de forma multivariada um conjunto de dados. Assim, as ferramentas quimiométricas podem ser utilizadas de várias maneiras como, por exemplo, no planejamento e otimização de experimentos, reconhecimento de padrões, classificação, regressão multivariada e modelagem, entre outros [54]. A quimiometria pode ser dividida em dois tipos de análise de dados: (i) a análise qualitativa (supervisionada e não supervisionada), utilizada para o reconhecimento de padrões e classificação de amostras; e (ii) a análise quantitativa, utilizada na construção de modelos de regressão multivariada para a previsão de uma propriedade de interesse.

A análise qualitativa não supervisionada, ou simplesmente análise exploratória, consiste na extração de informação do conjunto de dados, tais como tendências ou agrupamentos. Além disso, a análise é feita sem a necessidade de alguma suposição inicial ou informação específica do conjunto de dados. Os métodos mais utilizados e difundidos para este fim são a análise de agrupamentos hierárquicos (HCA – Hierarchical Cluster Analysis) [55] e a análise de componentes principais (PCA – Principal Component Analysis) [56]. Por outro lado, para realizar uma análise qualitativa supervisionada, é preciso de uma suposição inicial sobre o sistema (a qual classe cada amostra pertence, por exemplo) e são utilizados para construir modelos de classificação de amostras. Alguns exemplos de métodos qualitativos supervisionados são: SIMCA (Soft Independent Modelling of Class Analysis), redes neurais artificiais (ANN, Artificial Neural Network), máquinas de vetores de suporte (SVM – Support Vector Machine), método do k-ésimo vizinho mais próximo (KNN – K-Nearest Neighbor), e análise discriminante por mínimos quadrados parciais (PLS-DA – Partial Least Squares Discriminant Analysis) [57]. Esses métodos poderiam ser usados, por exemplo, para a classificação de micro-organismos utilizando apenas seus espectros SERS na construção do modelo.

(35)

A análise quantitativa empregando ferramentas quimiométricas consiste na construção de modelos de regressão multivariados para determinar o valor de uma propriedade de interesse. Por exemplo, os espectros SERS de um conjunto de amostras de urina poderiam ser utilizados na construção de um modelo quimiométrico para prever concentrações de ácido úrico. Alguns dos métodos quimiométricos que podem ser empregados com fins quantitativos são: regressão por componentes principais (PCR – Principal Component Regression) [58], redes neurais artificiais (ANN - Artificial Neural Network) [59], regressão por máquinas de vetores de suporte (SVMR - Support Vector Machines Regression) [60], regressão por mínimos quadrados parciais (PLSR – Partial Least Squares Regression) [58,61], e Resolução Multivariada de Curvas (MCR – Multivariate Curve Resolution) [62].

Para a utilização destas ferramentas quimiométricas qualitativas e quantitativas, os dados espectroscópicos são normalmente arranjados como uma matriz de dados X, como mostrado na Figura 5. Neste arranjo, os espectros das amostras são representados nas linhas enquanto as colunas referem-se às variáveis (e.g. intensidade em diferentes números de onda).

Figura 5: Representação do arranjo de dados espectroscópicos em quimiometria.

Tendo em vista a grande variedade de métodos quimiométricos existentes, nesta tese, serão apresentados somente aqueles que foram usados para o tratamento dos dados obtidos.

(36)

1.4.1 Análise de Componentes Principais (PCA)

A PCA é um método quimiométrico não supervisionado projeta as amostras em um espaço de dimensão reduzida, sem alterar de forma significativa a relação existente entre as amostras. Como resultado, informações altamente relevantes podem ser obtidas. Em termos matriciais, a PCA pode ser descrita como um método para decompor uma matriz Xij (com i linhas e j colunas) em duas matrizes menores

(Tin e Pjn) e uma matriz de resíduos (Eij). A matriz de escores (Tin) expressa a relação

entre as amostras, apresentando as suas coordenadas em um novo sistema de eixos de dimensões reduzidas, sendo a dimensão inicial e final igual a j e n, respectivamente. A matriz de pesos (Pjn) está relaciona às variáveis, identificando o

quanto cada uma delas contribuiu na formação das n componentes principais. Essas componentes principais são individualmente descritas pelo produto tp′. Por fim, a matriz de resíduos (Eij) representa a variância não descrita pelas componentes

principais selecionadas. A PCA pode então ser descrita pela seguinte equação:

𝐗 = ⁡ 𝐭1𝐩1 + 𝐭2𝐩2… + 𝐭n𝐩n + 𝐄 = 𝐓𝐏′+ 𝐄 (11)

Essa redução da dimensionalidade do conjunto de dados (matriz X) também pode ser expressa graficamente, como mostrado na Figura 6.

Figura 6: Representação esquemática da PCA para n componentes principais.

A PCA resume a informação de variáveis correlacionadas, que representam um comportamento frequentemente observado em dados químicos (e.g.

(37)

intensidades em diferentes números de onda). As componentes principais são então uma combinação linear das variáveis originais, sendo que as primeiras componentes principais usualmente descrevem a maior parte da variância/informação contida nos dados. Desta forma, um gráfico dos escores descreve as similaridades e diferenças entre as amostras, enquanto que o gráfico de pesos descreve a importância de cada variável original no modelo PCA. Isto possibilita a visão geral dos dados, revelando relações entre as variáveis e as amostras. Além disso, as componentes principais geradas podem ser utilizadas como base para a construção de modelos quimiométricos de regressão multivariada e a identificação de amostras anômalas no mesmo. Por exemplo, como descrito na Figura 7, os valores de T2 de Hotelling

(associado às componentes principais significativas, TP’) e de resíduos Q (associado às componentes principais remanescentes/não significativos, E) podem ser utilizados para detectar tendências não usuais dentro e fora do modelo [63].

Figura 7: Representação espacial dos valores de T2 de Hotelling e resíduos Q para

a identificação de amostras anômalas.

Os valores de T2 e resíduos Q são calculados segundo as seguintes

equações:

Ti2 = ⁡ 𝐭iλ−1𝐭i′ = 𝐱i𝐏λ−1𝐏′𝐱i′ (12) Qi = ⁡ 𝐞i𝐞i = 𝐱i(𝐈 − 𝐏k𝐏k′)𝐱i′ (13)

(38)

onde 𝐭i são os escores relativos aos componentes principais retidos no modelo, λ são os autovalores associados com os componentes principais retidos no modelo,⁡𝐏 é a matriz de pesos retidos no modelo, 𝐱i é a i-ésima linha de 𝐗,⁡𝐞i é a i-ésima linha

de 𝐄, ⁡𝐈 é a matriz identidade e k é o número de componentes principais. Assim, para amostras anômalas (‘‘outliers’’) valores simultaneamente altos de T2 e de Q serão

observados, sendo os valores limites para esses parâmetros são estabelecidos segundo o grau de confiança desejado (usualmente de 95%).

1.4.2 Análise discriminante por mínimos quadrados parciais (PLS-DA)

O método PLS, ou regressão PLS, é uma ferramenta quimiométrica amplamente utilizada que busca encontrar uma relação quantitativa entre o conjunto de respostas instrumentais (matriz X) e uma propriedade de interesse (matriz/vetor Y). Para tal, as matrizes X e Y são decompostas em suas componentes através de uma redução de variáveis (de forma similar à PCA), de tal forma que proporcionem o máximo de covariância entre X e Y. De forma didática, pode-se dizer que, no modelo PLS ocorre uma leve rotação dos eixos das componentes principais com o objetivo de maximizar a covariância com a matriz Y. Após essa leve rotação, as componentes principais são chamadas de variáveis latentes e são utilizadas para construir o modelo de regressão inversa, no qual as matrizes X e Y podem ser expressas em termos dos fatores extraídos segundo:

𝐗 = 𝐓n𝐏n′ + 𝐄 (14) 𝐘 = 𝐔n𝐐n′ + 𝐅 (15)

onde T e U são os escores, P e Q são os pesos, as matrizes E e F são os resíduos de X e Y, respectivamente, e n é a dimensão do subespaço das variáveis latentes. Os escores T são ortogonais e são estimados através da combinação linear da matriz X e os coeficientes pesos W* segundo:

𝐓 = 𝐗𝐖∗ (16)

Os escores T são bons previsores de Y, e assume-se que as matrizes X e Y são modeladas pelo mesmo número de variáveis latentes.

(39)

𝐘 = 𝐓𝐐+ 𝐅 (17)

Assim, a matriz F contém a diferença entre as respostas observada e modelada. As equações podem ser então reescritas da seguinte maneira:

𝐘 = 𝐗𝐖∗𝐐+ 𝐅 = 𝐗𝛃 + 𝐅 (18) 𝛃 = 𝐖∗𝐐 (19)

𝐖∗ = 𝐖(𝐏𝐖)−𝟏 (20)

𝐖 = 𝐗′𝐔/𝐔′𝐔 (21)

onde W é definido em função do conjunto de pesos do modelo PLS e maximiza a covariância entre X e Y. Maiores detalhes sobre o modelo PLS podem ser encontrados no trabalho publicado por Wold e colaboradores [61].

A escolha do número de variáveis latentes n é de vital importância para a construção do modelo PLS (ou PLS-DA) [63]. Um número muito grande de variáveis latentes pode levar a incorporação de informação não relacionada com a propriedade de interesse (ruído, por exemplo) e pode resultar em um modelo PLS sobreajustado. Por outro lado, o uso de um número reduzido de variáveis latentes pode resultar em um modelo PLS subajustado, o que também implica uma baixa capacidade preditiva. A escolha do número de variáveis latentes é comumente feita através e um procedimento de validação cruzada, na qual uma parte das amostras (ou apenas uma) é retirada e utilizada para validar o modelo. Esse processo é ilustrado na Figura 8, onde são separadas as amostras de calibração e validação, e o erro de validação é avaliado em função do número de variáveis latentes selecionada. Desta forma, o número de variáveis latentes a ser escolhido será o mínimo necessário para proporcionar um erro de previsão aceitável (princípio de parcimônia). Após a construção do modelo de calibração, novas amostras são utilizadas para verificar a capacidade de previsão do modelo.

(40)

Figura 8: Processo de separação de amostras de calibração e validação na validação cruzada.

Particularmente, para a construção de modelos de classificação baseados em PLS-DA, a matriz de resposta (Y) é constituída por valores de 1 e 0, que indicam se uma amostra pertence ou não, respectivamente, a uma classe definida. Um valor limite (‘‘threshold’’) para a separação das classes é definido usando a teoria de Bayes [64], na qual se assume que a variância prevista de Y segue uma distribuição similar para as amostras analisadas e amostras futuras. Apesar de ser uma ferramenta quimiométrica qualitativa, a validação do modelo PLS-DA pode ser feita calculando parâmetros de desempenho [65], tais como taxa de falsos positivos (TFP), taxa de falsos negativos (TFN), taxa de sensibilidade (TSB), taxa de especificidade/seletividade (TEP) e taxa de eficiência (TEF), estimados pelas equações: TFP = FP/(FP + VN) × 100 (22) TFN = FN/(FN + VP) × 100 (23) TSB = VP/(VP + FN) × 100 (24) TEP = VN/(VN + FP) × 100 (25) TEF = 100 − (TFP + TFN) (26)

onde VP e VN são os números de amostras corretamente classificadas pelo modelo como pertencentes ou não a uma determinada classe. Além disso, o falso positivo (FP) é o número de amostras que não pertencem a uma determinada classe, porém, foram classificados como pertencendo, e o falso negativo (FN) é o parâmetro oposto.

(41)

Deve-se notar que esses parâmetros possuem o mesmo nome que aqueles comumente utilizados na validação analítica de métodos quantitativos, mas são diferentes na sua definição (sensibilidade, por exemplo).

Apesar de ainda não ser uma prática comum no desenvolvimento de métodos quimiométricos, o cálculo da confiabilidade dos resultados é um parâmetro de extrema importância. Neste sentido, no modelo PLS-DA, além da atribuição da classe para cada amostra, a incerteza desta atribuição pode-se calcular através do método de reamostragem bootstrap. A técnica de bootstrap permite obter uma boa estimativa dos parâmetros estatísticos, tais como o viés, desvio padrão e intervalos de confiança. Nesta tese, o bootstrap residual foi calculado seguindo a estratégia proposta por Almeida et al. [13], que mostrou excelentes resultados para a classificação de óleos por espectroscopia Raman.

O cálculo de incerteza pela técnica bootstrap pode ser resumida em quatro etapas. (1) Os resíduos F do modelo PLS-DA são calculados por meio das seguintes equações:

𝐅 = (𝐘⁡– 𝐘PLS)/√(1 − PDF/N) (27) PDF = N × (1 − √MSEC/MSECV) (28)

MSEC = ∑(y − yPLS)2/N (29)

MSECV = ∑(y − yPLSCV)2/N (30)

onde 𝐘 contém os valores de referência (0 ou 1), 𝐘PLS contém os valores previsto pelo modelo, PDF é o número de pseudo-graus de liberdade, N é o número de amostras de calibração, MSEC é o erro quadrático médio de calibração, MSECV é o erro quadrático médio de validação cruzada e yPLSCV é o valor previsto por validação cruzada. (2) Os resíduos do modelo são gerados através de substituições aleatórias com reposição dos valores iniciais. Os resíduos bootstrap (𝐅∗) e os valores previstos 𝐘PLS são então usados para construir a matriz 𝐘∗ segundo:

𝐘∗ = 𝐘

(42)

(3) A matriz 𝐘∗ é utilizada para construir um novo modelo PLS, obtendo os

coeficientes de regressão bootstrap, que permitem o cálculo dos novos valores de 𝐘̂∗ e dos novos resíduos:

𝐅̂∗ = 𝐘𝐏𝐋𝐒− 𝐘̂∗ (32)

(4) Por fim, os intervalos de confiança são calculados usando os quartis da distribuição 𝐅̂∗ e o método do percentil, resultando em um intervalo assimétrico e específico para cada amostra:

𝐅̂B(α/2)∗ ≤ ysample ≤ 𝐅̂B(1−α/2)∗ (33)

onde B é o número de bootstraps e α é o nível de significância.

1.4.3 Resolução multivariada de curvas com mínimos quadrados

alternantes (MCR-ALS)

Os métodos de resolução multivariada de curvas são uma familia de técnicas de processamentos aplicados a um conjunto de dados para resolver misturas de sinais [66]. Neste sentido, o MCR decompõe o conjunto de dados segundo:

𝐗 = 𝐂𝐒+ 𝐄 (34)

onde, C é a matriz associada à concentração, S é a matriz contendo os perfis espectrais e E comtem os erros. Devido à sua fácil implementação para dados químicos, o método mais utilizado atualmente é a resolução multivariada de curvas empregando o algoritmo de mínimos quadrados alternados (MCR-ALS – Multivariate Curve Resolution-Alternating Least Squares) [66]. Esta ferramenta pode ser utilizada para constuir, de forma iterativa, modelos quimiométricos que relacionam os espectros puros e as concentrações de cada espécie participante da mistura. Assim, as matrizes C e S′ são encontradas de tal forma que o seu produto seja similar à matriz X com o mínimo erro possível.

(43)

Como primeira etapa, o MCR-ALS selecciona o número de componentes/espécies presentes no sistema. Essa seleção pode ser feita com base no conhecimento prévio do sistema ou por decomposição de valores singulares (SVD – Singular Value Decomposition) [67]. No SVD, as matrizes U e V são quadradas e ortogonais e S é retangular, sendo que os elementos que formam a diagonal são os valores singulares e os demais elementos são zero (equação 35). Os valores singulares dão informação sobre o número de componentes/espécies presentes na mistura. O número de valores singulares maiores que o ruído indica o número de componentes químicos independentes presentes na amostra.

𝐗 = 𝐔𝐒𝐕 (35)

Depois, estimativas iniciais de cada componente/especie são requereridas. No entanto, nem sempre se tem o conhecimento da composição real da amostra a ser analisada e o conhecimento de todas espécies presentes. Assim, essas estimativas podem ser feitas ou com base no conhecimento dos espectros puros de cada uma das espécies ou por métodos de seleção de variáveis puras como, por exemplo, SIMPLISMA (SIMPLe-to-use InteractiveS Mixture Analysis) [68] ou EFA (Envolving Factor Analisis) [67].

Depois disso, o processo de otimização ALS é realizado pela resolução da seguinte equação:

𝐂 = 𝐗∗𝐒+ (36)

onde S+ é a matriz pseudo-inversa de S. Em cada iteração, uma matriz S nova é

estimada segundo:

𝐒 = 𝐂+𝐗 (37)

Finalmente, uma nova estimativa da matriz X é gerada a partir das novas matrizes C e S′, e o procedimento é repetido até minimizar o erro E. Desde que as soluções do MCR-ALS não são únicas, diferentes combinações das matrizes C e S′ podem gerar a mesma matriz X, apesar de muitas destas soluções não possuírem

Referências

Documentos relacionados

Todos esses quadrados tˆem as medidas de seus lados, em cent´ımetros, expressas por n´ umeros inteiros positivos.. Seja p um n´ umero primo

método interpretativo, passagem essa fundamen- tada na mudança de concepção freudiana a respeito da causação da histeria, do privilégio do trauma, do afeto e de sua

O quinto artigo – “Violência nas relações juvenis de intimidade: Uma revisão da teoria, da investigação e da prática” – resume as principais refle- xões e resultados

Distribution: Asia, South America; BRAZIL: Dias (1992); first citation for the state of Rio Grande do Sul. Habitat and abiotic variables: metaphyton; fila- ments associated

Os documentos necessários à formalização do pedido estão nos autos (Lei 6.815/80, art. Carlos Velloso). Cabe ao Ministério das Relações Exteriores o recebimento do pedido,

Os espaços naturais não formais de ensino apresentam-se como uma oportunidade de aproximação do aluno com a natureza, como caminho para um aprendizado

Na busca de uma metodologia que desse conta de simular, emular e encenar os cenários que o contexto social e econômico exigem, apontando com clareza indicadores de

Além disso, pôde-se perceber que a utilização de oficinas como método de ensino de educação ambiental mostrou-se uma ferramenta válida para a abordagem de questões