• Nenhum resultado encontrado

Espectroscopia no infravermelho próximo e métodos de calibração multivariada aplicados à determinação simultânea de parâmetros bioquímicos em plasma sanguíneo

N/A
N/A
Protected

Academic year: 2017

Share "Espectroscopia no infravermelho próximo e métodos de calibração multivariada aplicados à determinação simultânea de parâmetros bioquímicos em plasma sanguíneo"

Copied!
109
0
0

Texto

(1)

Ana Carolina de Oliveira Neves

Espectroscopia no infravermelho próximo e métodos de calibração

multivariada aplicados à determinação simultânea de parâmetros

bioquímicos em plasma sanguíneo

_______________________________________

Dissertação de Mestrado

Natal/RN, fevereiro de 2013

INSTITUTO DE QUÍMICA

(2)

PROGRAMA DE PÓS-GRADUAÇÃO EM QUÍMICA

Ana Carolina de Oliveira Neves

Espectroscopia no infravermelho próximo e métodos de calibração multivariada aplicados à determinação simultânea de parâmetros bioquímicos em plasma sanguíneo

Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Química da Universidade Federal do Rio Grande do Norte, como parte dos requisitos necessários para obtenção do título de Mestre em Química.

Orientador: Prof. Dr. Kássio Michell Gomes de Lima

(3)

Divisão de Serviços Técnicos

Catalogação da Publicação na Fonte. UFRN / Biblioteca Setorial do Instituto de Química

Neves, Ana Carolina de Oliveira.

Espectroscopia no infravermelho próximo e métodos de calibração multivariada aplicados à determinação simultânea de parâmetros bioquímicos em plasma sanguíneo / Ana Carolina de Oliveira Neves. Natal / RN, 2013.

106 f.

Orientador: Kássio Michell Gomes de Lima

Dissertação (Mestrado em Química) - Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Programa de Pós-Graduação em Química.

1. Análises clínicas - Dissertação. 2. Espectroscopia no infravermelho próximo - Dissertação. 3. Calibração multivariada.- Dissertação. I. Lima, Kássio Michell Gomes de. III. Universidade Federal do Rio Grande do Norte. IV. Título.

(4)
(5)

Com amor, dedico

A Deus, pela sua força, principalmente, nos momentos em que a minha já não existia mais. Por me iluminar e permitir a realização deste trabalho.

Aos meus pais, Gladson e Maria da Conceição, por todo amor e cuidado que sempre recebi. Vocês são o que há de melhor em mim.

Ao meu irmão, Flávio, pelo lugar que ocupa em meu coração.

Aos meus Avós, Walquíria (in memoriam) e Nildo, e Consuelo e Benedito.

(6)

Ao meu orientador, Prof. Dr. Kássio Michell Gomes de Lima, sempre tão presente durante a realização deste trabalho. Por sua orientação segura, atenção, paciência e, sobretudo, motivação. Também agradeço de coração, como amiga, por sua compreensão nos momentos em que estive mais ausente do laboratório, em virtude da preparação do meu casamento.

A Prof.ª Aurigena Antunes, do Departamento de Biociências da UFRN, por gentilmente colaborar com este trabalho não somente cedendo as amostras utilizadas, mas também sempre acreditando que seria possível realizá-lo.

Ao meu esposo, Fabrício, por me apoiar a cada dia com sua imensa generosidade, cumplicidade, carinho e paciência; além das (sempre bem vindas) ajudas em química orgânica.

Aos meus pais que, antes de tudo, me educaram priorizando a importância dos estudos tanto em minha formação profissional quanto pessoal e, ainda, por me estimularem em cada nova etapa de minha vida.

Aos meus amigos do GPQA pela companhia, momentos de descontração, momentos

de tensão (quando “nada fazia muito sentido”) e por compartilharmos juntos nossos aprendizados.

(7)

“... a tarefa não é tanto ver aquilo que ninguém viu, mas pensar o que ninguém ainda pensou sobre aquilo que todo mundo vê.”

(8)

No presente trabalho, a análise quantitativa de glicose, triglicerídeos e colesterol (total e HDL) em plasma sanguíneo de ratos e humanos foi realizada sem necessidade de pré-tratamentos de amostras, através do uso da espectroscopia no infravermelho próximo (NIR), aliada a métodos multivariados. Para tanto, foram comparadas diferentes técnicas e algoritmos utilizados para pré-processamentos de dados, seleção de variáveis e regressões multivariadas, tais como a regressão por mínimos quadrados parciais (PLSR), regressão não linear via redes neurais artificiais (ANN), regressão por mínimos quadrados parciais por intervalos (iPLS), algoritmo genético (GA), algoritmo das projeções sucessivas (SPA), entre outros. Para as determinações em sangue de ratos, os algoritmos de seleção de variáveis apresentaram resultados satisfatórios tanto em relação aos coeficientes de correlação (R²) quanto para os valores de erro quadrático médio de previsão (RMSEP) para os três analitos, especialmente para triglicerídeos e colesterol-HDL. Os valores de RMSEP para glicose, triglicerídeos e colesterol-HDL através do melhor modelo PLS foram de 6,08, 16,07 e 2,03 mg dL-1, respectivamente. Para as determinações em sangue de humanos, as previsões através de modelos PLS apresentaram resultados insatisfatórios, com comportamento não linear e presença de bias. A regressão ANN foi investigada como uma alternativa ao PLS, por sua

habilidade de modelar sistemas não lineares. O erro quadrático médio de monitoramento (RMSEM) para glicose, triglicerídeos e colesterol total, para os melhores modelos ANN, foram de 13,20, 10,31 e 12,35 mg dL-1, respectivamente. Testes estatísticos (F e t) sugerem que a espectroscopia NIR aliada a métodos de regressão multivariados (PLS e ANN) possuem capacidade de quantificar os analitos (glicose, triglicerídeos e colesterol) mesmo quando os mesmos estão presentes em fluidos biológicos altamente complexos, como o plasma sanguíneo.

(9)

In this work, the quantitative analysis of glucose, triglycerides and cholesterol (total and HDL) in both rat and human blood plasma was performed without any kind of pre-treatment of samples, by using near infrared spectroscopy (NIR) combined with multivariate methods. For this purpose, different techniques and algorithms used to pre-process data, to select variables and to build multivariate regression models were compared between each other, such as partial least squares regression (PLS), non linear regression by artificial neural networks, interval partial least squares regression (iPLS), genetic algorithm (GA), successive projections algorithm (SPA), amongst others. Related to the determinations of rat blood plasma samples, the variables selection algorithms showed satisfactory results both for the correlation coefficients (R²) and for the values of root mean square error of prediction (RMSEP) for the three analytes, especially for triglycerides and cholesterol-HDL. The RMSEP values for glucose, triglycerides and cholesterol-HDL obtained through the best PLS model were 6.08, 16.07 e 2.03 mg dL-1, respectively. In the other case, for the determinations in human blood plasma, the predictions obtained by the PLS models provided unsatisfactory results with non linear tendency and presence of bias. Then, the ANN regression was applied as an alternative to PLS, considering its ability of modeling data from non linear systems. The root mean square error of monitoring (RMSEM) for glucose, triglycerides and total cholesterol, for the best ANN models, were 13.20, 10.31 e 12.35 mg dL-1, respectively. Statistical tests (F and t) suggest that NIR spectroscopy combined with multivariate regression methods (PLS and ANN) are capable to quantify the analytes (glucose, triglycerides and cholesterol) even when they are present in highly complex biological fluids, such as blood plasma.

(10)

Figura 1- Formas estruturais da glicose no sangue e suas respectivas proporções ... 19 Figura 2- Estrutura genérica de um triglicerídeo e exemplos de ácido graxos 20 Figura 3- Estrutura química do colesterol ... 20 Figura 4- Representação esquemática de uma lipoproteína de baixa

densidade (LDL) ... 21 Figura 5- Ilustração comparativa das estruturas do HDL e do LDL ... 22 Figura 6- Proporção de mortes globais por doenças não transmissíveis, em

pessoas com idade inferior a 70 anos, no ano de 2008 ... 24 Figura 7- Reações químicas envolvidas na determinação de glicose através

do método enzimático-colorimétrico ... 25 Figura 8- Reações químicas envolvidas na determinação de triglicerídeos

através do método enzimático-colorimétrico ... 26 Figura 9- Reações químicas envolvidas na determinação de colesterol

através do método enzimático-colorimétrico ... 27 Figura 10- Componentes básicos de um equipamento que opera na região do

infravermelho ... 32 Figura 11- Tipos de movimentos vibracionais existentes em ligações

químicas: a) estiramentos; b) deformações ... 33 Figura 12- Modelos harmônico (A) e anarmônico (B) para espectroscopia

vibracional ... 35 Figura 13- Comparação entre métodos univariado (b) e multivariado (c) para

análise de gordura a partir de espectros obtidos na região do NIR (a) ... 39 Figura 14- Ilustração esquemática de construção de uma matriz de respostas

instrumentais ... 40

Figura 15- Projeção de X no espaço d-dimensional ... 42 Figura 16- Fatores influentes na escolha do número de componentes ... 43 Figura 17- Exemplos de gráficos de valores de resíduos contra valores

(11)

para frente; b) propagação para trás do erro ... 49 Figura 19- Seleção de variáveis, via iPLS, dentro de uma área espectral

ampla... 54 Figura 20- Ilustração esquemática do princípio de funcionamento do

algoritmo genético ... 56 Figura 21- Ilustração esquemática da etapa de mutação que acontece no

algoritmo genético ... 56 Figura 22- “Ciclo de evolução” básico do algoritmo genético ... 57 Figura 23- Detecção de amostras anômalas em modelos lineares: (a) anômala

em y; (b) anômala em x e y; (c) anômala em x ... 58 Figura 24- Propriedades da distribuição normal: (i) aproximadamente 68%

dos valores caem em ± 1σ da médiaν (ii) aproximadamente λ5% dos valores caem em ± 2σ da médiaν (iii) aproximadamente λλ,7% dos valores caem em ± 3σ da média ... 62 Figura 25- Espectros NIR originais das 23 amostras de plasma sanguíneo de

ratos ... 72 Figura 26- Espectros NIR das 23 amostras de plasma sanguíneo de ratos, após

corte da região de 1900 a 2000 nm ... 74 Figura 27- Espectro NIR das 23 amostras de plasma sanguíneo de ratos após

aplicação da suavização SG com janelas de três pontos ... 75 Figura 28- Ampliação da banda de absorção na faixa de 1450 nm após

aplicação da suavização SG com polinômio do 1º grau; A) janelas de 3 pontos; B) janelas de 11 pontos ... 75 Figura 29- Espectros NIR das 23 amostras de plasma sanguíneo de ratos após

a aplicação da derivada SG; A) primeira ordem; B) segunda ordem... 76 Figura 30- Concentrações preditas (PLS) contra medidas (método enzimático)

(12)

de validação ... 82 Figura 32- Concentrações preditas (PLS) contra medidas (método enzimático)

das amostras de calibração e validação, em plasma sanguíneo de ratos, para HDL; (o) conjunto de calibração; (*) conjunto de validação ... 85 Figura 33- Espectros NIR originais das 34 amostras de plasma sanguíneo de

humanos ... 86 Figura 34- EJCR para a inclinação e intercepto da regressão dos valores

previstos (ANN) contra valores medidos (método enzimático), para as amostras de monitoramento dos melhores modelos: (azul) glicose; (vermelho) triglicerídeos; (verde) colesterol ... 89 Figura 35- Concentrações preditas contra medidas (método enzimático) das

(13)

Tabela 1- Regiões espectrais no infravermelho ... 30 Tabela 2- Variabilidade dos parâmetros bioquímicos no plasma sanguíneo dos

23 ratos Wistar ... 68 Tabela 3- Variabilidade dos parâmetros bioquímicos no plasma sanguíneo

humano de 34 pacientes de esquizofrenia ... 69 Tabela 4- Parâmetros de treinamento das redes neurais ... 71 Tabela 5- Resultados para os conjuntos de calibração e validação externa para

glicose: RMSECV, RMSEP, coeficientes de correlação (R) e o número de variáveis espectrais utilizadas (tamanho). O número de fatores nos modelos PLS, iPLS, PLS-SPA e PLS-GA são representados entre parênteses... 77

Tabela 6- Valores medidos (referência) e preditos (NIR) para as amostras de previsão do melhor modelo, PLS (4)1, referentes à determinação de glicose ... 79 Tabela 7- Resultados para os conjuntos de calibração e validação externa para

triglicerídeos: RMSECV, RMSEP, coeficientes de correlação (R) e o número de variáveis espectrais utilizadas (tamanho). O número de fatores nos modelos PLS, iPLS, PLS-SPA e PLS-GA são representados entre parênteses ...

80 Tabela 8- Valores medidos (referência) e preditos (NIR) para as amostras de

previsão do melhor modelo, PLS (4)1, referentes à determinação triglicerídeos ... 82 Tabela 9- Resultados para os conjuntos de calibração e validação externa para HDL:

RMSECV, RMSEP, coeficientes de correlação (R) e o número de variáveis espectrais utilizadas (tamanho). O número de fatores nos modelos PLS, iPLS, PLS-SPA e PLS-GA são representados entre parênteses ... 83

Tabela 10- Valores medidos (referência) e preditos (NIR) para as amostras de

previsão do melhor modelo, PLS (4)1, referentes à determinação

HDL ... 85 Tabela 11- Resultados dos melhores modelos ANN para os conjuntos de

(14)
(15)

ANN – redes neurais artificais (do inglês, artificial neural networks)

ASTM – Sociedade Americana para Testes e Materiais (do inglês, American Society for

Testing and Materials),

ATP – trifosfato de adenosina (do inglês, adenosine triphosphate)

CLAE – cromatografia líquida de alta eficiência CM – centragem na média

CV – validação cruzada (do inglês, cross validation)

DNA – ácido desóxiribonuclêico (do inglês, desoxyribonucleic acid)

EJCR – região de confiança elíptica conjunta (do inglês, elliptical joint confidence region)

FIR – infravermelho distante (do inglês, far infrared)

GA – algoritmo genético (do inglês, genetic algorithm)

HDL lipoproteína de alta densidade (do inglês, high-density lipoprotein)

Ip – injeções salinas intraperitoniais

iPLS regressão pelo método do mínimos quadrados por intervalos (do inglês, interval

partial least squares),

IR – infravermelho (do inglês, infrared)

KS – algoritmo de seleção de amostras Kennard-Stone

LDL – lipoproteína de baixa densidade (do inglês, low-density lipoprotein)

MATLAB –software para cálculos numéricos (Matrix Laboratory)

MIR – infravermelho médio (do inglês, mid-infrared)

NIR – infravermelho próximo (do inglês, near infrared)

NCEP – programa nacional educacional sobre colesterol (do inglês, national cholesterol

education program)

N-PLS – regressão pelo método dos mínimos quadrados parciais não lineares (do inglês,

non-linear partial least squares)

PC – componente principal (do inglês, principal component)

PCA – análise por componentes principais (do inglês, principal component analysis)

PCR – regressão em componentes principais (do inglês, principal component regression)

PLS – mínimos quadrados parciais (do inglês, partial least squares)

RMSEC – raiz quadrada do erro médio de calibração (do inglês, root mean square error of

calibration)

(16)

RMSEP – raiz quadrada do erro médio de previsão (do inglês, root mean square error of

prediction)

RNA – ácido ribonuclêico (do inglês, ribonucleic acid)

rpm – rotações por minuto

SEC – erro padrão de calibração (do inglês, standard error of calibration)

SG – Savitzky-Golay

SEP – erro padrão de previsão (do inglês, standard error of prediction)

SPA – algoritmo das projeções sucessivas (do inglês, successive projections algorithm)

SVM – máquinas de vetores de suporte (do inglês, support vector machine)

UV – ultravioleta

VLDL – lipoproteína de muito baixa densidade (do inglês, very low-density lipoprotein)

(17)

1 INTRODUÇÃO ... 18

1.1 ANÁLISES CLÍNICAS E PARÂMETROS BIOLÓGICOS... 18

1.1.1 Glicose ... 18

1.1.2 Triglicerídeos ... 19

1.1.3 Colesterol ... 20

1.2 SÍNDROME METABÓLICA E DOENÇAS NÃO TRANSMISSÍVEIS 22 1.3 MÉTODOS TRADICIONAIS PARA DETERMINAÇÃO DE GLICOSE, TRIGLICERÍDEOS E COLESTEROL ... 25

1.3.1 Determinação de glicose ... 25

1.3.2 Determinação de triglicerídeos ... 26

1.3.3 Determinação de colesterol ... 27

1.4 INFRAVERMELHO: a descoberta ... 29

1.4.1 Espectroscopia no infravermelho próximo ... 30

1.4.1.1 Principais características e aplicações ... 31

1.4.1.2 Instrumentação ... 32

1.4.2 Aspectos teóricos da espectroscopia NIR ... 32

1.5 QUIMIOMETRIA E CALIBRAÇÃO MULTIVARIADA ... 37

1.5.1 Análise por componentes principais – PCA ... 41

1.5.2 Regressão por mínimos quadrados parciais – PLS ... 44

1.5.3 Redes neurais artificiais – ANN ... 47

1.5.4 Pré-processamento de dados ... 50

1.5.4.1 Centragem na média ... 51

1.5.4.2 Suavização ou filtro digital ... 51

1.5.4.3 Derivada ... 52

1.5.5 Seleção de amostras ... 53

1.5.6 Seleção de variáveis ... 53

1.5.6.1 Mínimos quadrados parciais por intervalos – iPLS ... 54

1.5.6.2 Algoritmo das projeções sucessivas – SPA ... 55

1.5.6.3 Algoritmo genético – GA ... 55

1.5.7 Detecção de amostras anômalas (outliers) ... 57

(18)

2 JUSTIFICATIVAS E OBJETIVOS ... 66

3 PARTE EXPERIMENTAL ... 67

3.1 EXPERIMENTO EM ANIMAIS ... 67

3.2 EXPERIMENTO EM HUMANOS ... 67

3.3 MÉTODOS DE REFERÊNCIA ... 68

3.3.1 Plasma de ratos ... 68

3.3.2 Plasma de humanos ... 69

3.4 INSTRUMENTAÇÃO NIR ... 69

3.5 ANÁLISE DOS DADOS ... 70

3.5.1 Plasma de ratos ... 70

3.5.2 Plasma de humanos ... 70

4 RESULTADOS E DISCUSSÃO ... 72

4.1 ANÁLISES EM PLASMA SANGUÍNEO DE RATOS ... 72

4.1.1 Atribuição de bandas ... 72

4.1.2 Pré-processamentos espectrais ... 74

4.1.3 Determinação de glicose ... 76

4.1.4 Determinação de triglicerídeos ... 80

4.1.5 Determinação de HDL ... 83

4.2 ANÁLISES EM PLASMA SANGUÍNEO DE HUMANOS ... 86

4.2.1 Atribuição de bandas e pré-processamentos ... 86

4.2.2 Regressão multivariada linear – emprego do PLS ... 87

4.2.3 Quantificações de glicose, triglicerídeos e colesterol total através de regressão multivariada não linear – emprego do ANN ... 89

4.2.4 Comparação PLS versus ANN: quantificações de glicose, triglicerídeos e colesterol total ... 90

5 CONCLUSÕES ... 93

5.1 DETERMINAÇÕES DE GLICOSE, TRIGLICERÍDEOS E HDL EM PLASMA SANGUÍNEO DE RATOS ... 93

(19)
(20)

1 INTRODUÇÃO

“Não existem métodos fáceis para resolver problemas difíceis.”

(René Descartes)

1.1 ANÁLISES CLÍNICAS E PARÂMETROS BIOLÓGICOS

A análise clínica lida diretamente com a coleta de dados referentes a parâmetros biológicos e relaciona os mesmos à saúde de pacientes1.Uma vez que cerca de 60 a 70% das decisões médicas, atualmente, são baseadas em resultados obtidos através de testes diagnósticos in vitro, os mesmos desempenham um papel de extrema relevância na

identificação, tratamento e, inclusive, prevenção de diversas patologias2. Dessa forma, tais análises devem produzir resultados confiáveis e precisos, uma vez que falsos diagnósticos podem levar a decisões médicas inapropriadas e erros terapêuticos, e, consequentemente, tratamentos inadequados e desnecessários, além de altos gastos com repetitivas realizações de uma mesma análise, que poderiam ser evitados3.

A bioquímica clínica é responsável por analisar materiais orgânicos, tais como sangue, urina e fezes, mais especificamente, as dosagens de glicose, colesterol, triglicerídeos, ácido úrico, uréia, creatinina, ácido fólico,entre outros4. Sendo assim, tais investigações estão presentes em todos os ramos da medicina e, fortemente, inseridas nas relações entre médicos e pacientes.

1.1.1 Glicose

(21)

Figura 1 - Formas estruturais da glicose no sangue e suas respectivas proporções.

Fonte: Autor.

Distúrbios no metabolismo endócrino relacionados à glicose são conhecidos como diabetes.Aproximadamente 150 milhões de pessoas são diabéticas e estima-se que outros milhões apresentem a doença ainda não diagnosticada6. A diabetes mellitus é caracterizada pelos níveis insuficientes de insulina no sangue que, quando em nível muito baixo, fazem com que os músculos e o fígado não absorvam glicose e assim ocorra a hiperglicemia, que prejudica o metabolismo de gorduras e proteínas, e pode ocasionar diversas patologias tais como cegueira, danos no sistema nervoso, insuficiência renal, danos na formação fetal, aumento no risco de doenças cardíacas e amputações de membros, coma e, até mesmo, morte. Daí a importância de controlar periodicamente os níveis de glicose presentes no sangue, como forma de prevenir a ocorrência de diabetes, bem como, de suas complicações relacionadas7.

1.1.2 Triglicerídeos

Os lipídeos compõem uma grande família de substâncias com as mais variadas funções químicas presentes em suas estruturas, cuja característica em comum é a alta solubilidade em solventes orgânicos e baixa solubilidade em água (do grego lipo, gordura).

Lipídeos são de extrema importância para os organismos vivos devido às suas funções de armazenamento de energia, proteção, componentes das membranas celulares, mensageiros químicos e vitaminas. Os triglicerídeos (ou triacilgliceróis) são triésteres formados a partir do glicerol e ácidos carboxílicos graxos (cadeias longas, entre 12 e 20 átomos de carbono, saturadas ou insaturadas), conforme apresentado na Figura 2.

O HO HO OH OH OH O HO HO OH OH OH O H OH OH OH OH HO

-D-glicopiranose D-glicose -D-glicopiranose

(22)

Figura 2 - Estrutura genérica de um triglicerídeo e exemplos de ácido graxos.

Fonte:Autor.

Os triglicerídeos são os componentes majoritários dos óleos e gorduras, que têm como diferença o fato de os primeiros serem líquidos a temperatura ambiente e os segundos, sólidos, em função do número e natureza (cis ou trans) das insaturações presentes nas cadeias

desses ésteres. As gorduras possuem importante papel nos organismos vivos, atuando como fonte de energia, como isolante térmico e protegendo os mesmos contra choques mecânicos. Todavia, altos níveis de triglicerídeos no plasma sanguíneo podem estar diretamente relacionados à ocorrência de doenças cardiovasculares, em função, principalmente, do entupimento das veias e artérias, e podendo ser consequência de outras patologias, como, por exemplo, diabetes mellitus8-10.

1.1.3 Colesterol

Nos animais, o colesterol é o lipídeo mais abundante e importante pertencente à classe dos esteroides5,11. Conforme visto na Figura 3, sua estrutura química é derivada do esqueleto hidrocarbônico ciclopentilperidrofenantreno, contendo um grupamento álcool e uma insaturação.

Figura 3 - Estrutura química do colesterol.

Fonte:Autor.

Ao contrário do que se noticia, o colesterol não é um vilão. Tal lipídeo é componente do plasma sanguíneo e está presente em todas as células animais, como constituinte e regulador das membranas celulares. Além disso, atua no metabolismo de vitaminas

O O O O R3 O R2 O R1 triglicerídeo HO

O ácido olêico

(insaturado -9

O

HO

O

HO

ácido linolênico (poliinsaturado -3,6,9)

ácido esteárico (saturado)

HO

H

(23)

lipossolúveis (A, D, E e K) e é precursor sintético de outros esteroides, tais como os hormônios sexuais e adrenocorticóides, além de participar, também, na formação dos sais biliares (agentes dispersantes de lipídeos no organismo), sendo fundamental para que o organismo desempenhe de forma harmoniosa grande parte de suas funções.O colesterol é sintetizado no fígado, a partir de gorduras, e está em uma situação dinâmica, circulando constantemente pelo sangue. Todavia, por ser insolúvel no meio aquoso, o mesmo deve ser transportado, e para tal função existem as chamadas lipoproteínas, dentre elas: a LDL (lipoproteína de baixa densidade - do inglês low-density lipoprotein) e a HDL (lipoproteína de

alta densidade - do inglês high-density lipoprotein)5,9,12.

A LDL, conforme representada na Figura 4, é originada através da remoção dos triglicerídeos e proteínas (exceto a apoB-100) presentes em outra espécie de lipoproteína, chamada VLDL (do inglês, very low-density lipoprotein), no momento em que a mesma

atinge o tecido de músculos ou gorduras.A lipoproteína resultante é composta, agora, de 25% de proteínas e 50% de colesterol, além de outros lipídeos, incluindo alguns de caráter anfótero com relação à solubilidade em água (possuem uma parte hidrofílica e uma parte hidrofóbica)5,10.

Figura 4- Representação das espécies constituintes de uma lipoproteína de baixa densidade (LDL).

Fonte:http://thehealthycow.blogspot.com.br/2012/09/everything-you-need-to-know-about.html

A LDL é popularmente conhecida como “colesterol ruim”, justamente por executar a função de transporte do lipídeo até a superfície das células, mais precisamente, a receptores

Apoproteína B-100

Éster de colesterol

Éster de esterol

Fosfolipídeo

(24)

específicos que permitem que a mesma seja introduzida e, por ação de enzimas, libere o colesterol em sua forma livre5,7. A característica aterogênica associada a esta lipoproteína ocorrerá quando a mesma estiver em excesso, em função de altos níveis de colesterol produzidos a partir de uma dieta rica em gorduras. Tal fato, induz à deposição do lipídeo nos vasos sanguíneos, provocando, consequentemente, entupimento dos mesmos, podendo originar patologias tais como diabetes mellitus e aterosclerose, responsáveis por ataques cardíacos, derrames e disfunções renais5,7,9,10.

Nem todo colesterol depositado nas veias e artérias lá o permanece,e essa função de

“limpeza” é executada pela HDL. Esta lipoproteína, de tamanho menor que a LDL, é constituída de30% de proteínas e 30% de colesterol, além de outros lipídeos. Essa razão entre as espécies é que determina que a mesma possua alta densidade. Uma vez que a densidade das proteínas é maior que a do colesterol, a razão m/V aumenta quando em comparação à LDL. Tal fato é observado através da Figura 5, onde claramente se verifica a diferença tanto entre a proporção dos constituintes (proteínas e colesterol) quanto no tamanho das lipoproteínas LDL e HDL.

Figura 5 -Ilustração comparativa das espécies constituintes das estruturas do HDL e do LDL.

Fonte: http://www.umm.edu/patiented/articles/hdl_ldl_000362.htm

A HDL absorve parte do colesterol em excesso nas veias e artérias e o transporta até as células do fígado, onde o lipídeo irá atuar na síntese dos hormônios esteroidais e sais biliares.

Tal mecanismo, conhecido como “transporte reverso”, confere à HDL, popularmente, o título de “bom colesterol”, uma vez que tal lipoproteína atua evitando a formação de placas de ateromas e a ocorrência de diversas patologias a elas relacionadas7,9,10,13.

(25)

1.2 SÍNDROME METABÓLICA E DOENÇAS NÃO TRANSMISSÍVEIS

Como já mencionado nos itens 1.1.1 até 1.1.3, níveis anormais de glicose, triglicerídeos e colesterol presentes no sangue, frequentemente associados à obesidade, são responsáveis pela ocorrência de diferentes patologias. Entretanto, na década de 80, foi observado que havia, ainda, outro tipo de associação entre os fatores de risco para o desenvolvimento doenças cardiovasculares e diabetes, especialmente chamado de resistência insulínica. Dessa forma, surgiu a “síndrome metabólica” que, de acordo com a Sociedade Brasileira de Endocrinologia e Metabologia, é definida como um conjunto de doenças cuja base é a resistência insulínica, uma vez que além de retirar a glicose do sangue e levá-la até as células, a insulina também exerce diversas outras atividades no organismo, inclusive, durante o metabolismo de gorduras7,14-16. Os dois critérios mais aceitos para definição desta síndrome, são o da Organização Mundial de Saúde (WHO, do inglês, World Health Organization) e do

National Cholesterol Education Program (NCEP) – americano. Entretanto, o Brasil já dispõe

do seu Consenso Brasileiro sobre Síndrome Metabólica, que caracteriza que tal síndrome está presente quando no mínimo três dos critérios abaixo são positivos14,16:

i) Obesidade central - circunferência da cintura igual ou superior a 88 cm na mulher e 102 cm no homem;

ii) Hipertensão arterial - pressão arterial sistólica≥ 130 e/ou pressão arterial diatólica

≥ 85 mmHg;

iii) Glicemia alterada (glicemia em jejum > 100 mg dL-1) ou diagnóstico de diabetes;

iv) Triglicerídeos ≥ 150 mg dL-1;

v) HDL colesterol < 40 mg dL-1 em homens, e HDL colesterol<50 mg dL-1 em mulheres.

(26)

estejam nas faixas de risco para desenvolvimento de doenças graves, como as cardiovasculares e diabetes, e sequer tenham conhecimento disto7,14.

Das 57 milhões de mortes que ocorreram em todo o mundo, no ano de 2008, 36 milhões (aproximadamente 63%) foram causadas por doenças não transmissíveis, representadas proporcionalmente em seus diversos tipos através da Figura 6, segundo dados da Organização Mundial de Saúde17.

Figura 6 - Proporção de mortes globais por doenças não transmissíveis, em pessoas com idade inferior a 70 anos, no ano de 2008.

Fonte: adaptado da referência17

Em pessoas com idade abaixo de 70 anos, as doenças cardiovasculares foram responsáveis por 39% dos 36 milhões de mortes calculadas e, por sua vez, a diabetes representou um total de 4%, que é bastante inferior quando comparado às doenças cardiovasculares, porém, sem dúvidas, bastante significativo17.

Tais números elevados de mortes relacionadas a doenças não transmissíveis estão diretamente associados ao hábito de vida da população, especialmente no século 21, e fatores econômicos, que podem levar a um precário serviço de saúde pública. Sendo assim, melhorias nos setores de saúde, proporcionando detecção precoce e tratamento realizado de forma oportuna no momento em que a doença é diagnosticada, atuam como fatores indispensáveis para diminuição do impacto causado pela epidemia das doenças não transmissíveis, uma vez que as intervenções médicas realizadas nos tratamentos dessas patologias são de alto custo, principalmente quando a mesma atingiu estágios elevados, por falta de diagnósticoadequado17. Portanto, a Organização Mundial de Saúde tem incentivado que os países adotem políticas a níveis nacionais e globais com o objetivo, principalmente, de

Câncer

Doenças cardiovasculares

Doenças respiratórias crônicas

Diabetes

Doenças do aparelho digestivo

(27)

integrar a prevenção e controle dessas doenças. Neste sentido, os laboratórios de análises clínicas desempenham um papel de relevância na implementação destas metas, uma vez que contribuem diretamente para diagnósticos e tratamentos feitos com mais segurança, sendo, então, parte essencial dos processos de cuidados com os pacientes13.

1.3 MÉTODOS TRADICIONAIS PARA DETERMINAÇÃO DE GLICOSE,

TRIGLICERÍDEOS E COLESTEROL

Diversos são os métodos e técnicas relatados na literatura envolvendo análises de parâmetros bioquímicos3,13,18-20. Atualmente, o principal método aplicado em determinações rotineiras dos níveis de glicose, triglicerídeos e colesterol em fluidos sanguíneos, é chamado de enzimático colorimétrico, cujos protocolos oficiais são, inclusive, disponibilizados pela organização mundial de saúde12,21.O método é baseado em reações mediadas por enzimas, que levam à formação de substâncias coloridas, possíveis de serem analisadas por espectroscopia na região do visível.

1.3.1 Determinação de glicose

A glicose é um açúcar redutor, e pode ser oxidada ao derivado ácido glucônico, via reação com oxigênio molecular, na presença da enzima glicose oxidase. O subproduto da reação, peróxido de hidrogênio, reage com 4-aminofenazona (4-aminoantipirina), em presença de fenol e da enzima peroxidase, levando à formação do derivado cromógeno quinoneimina, cuja absorção máxima é em 505 nm. O método é ilustrado na Figura 7.

Figura 7 - Reações químicas envolvidas na determinação de glicose através do método enzimático-colorimétrico.

(28)

Ao se realizar uma determinação de um parâmetro biológico, deve-se levar em consideração as substâncias que podem interferir nos resultados da análise2,7. Com relação à glicose, os principais interferentes são: ácido ascórbico (acima de 10 mg dL-1), bilirrubina (acima de 20 mg dL-1), triglicerídeos (acima de 250 mg dL-1) e hemoglobina (acima de 160 mg dL-1)

1.3.2 Determinação de triglicerídeos

Na Figura 8 é apresentado o método enzimático colorimétrico para dosagem dos triglicerídeos. Toda reação de hidrólise de triglicerídeos, aqui mediada pela enzima lipase lipoprotéica, leva à formação de glicerol (juntamente com os ácidos graxos ou seus respectivos sais), que é fosforilado, em presença de ATP, Mg2+ e glicerolquinase, ao glicerol-3-fosfato. Este, por sua vez, é seguidamente oxidado a dihidroxiacetona pela ação de oxigênio em conjunto com a enzima glicerol-3-fasfato oxidase. O peróxido de hidrogênio formado nessa etapa de oxidação, em presença da enzima peroxidase (de forma similar ao procedimento envolvendo glicose) propicia a formação da quinoneimina (absorção máxima em 505 nm), através da reação entre 4-aminoantipirina e 4-clorofenol.

Figura 8 - Reações químicas envolvidas na determinação de triglicerídeos através do método enzimático-colorimétrico. Fonte:Autor. N N O NH2 + OH N N O N Cl peroxidase

4-aminoantipirina 4-clorofenol quinonimina (max = 505nm)

O O O O R2 O R1 O R3 triglicerídeos lipase lipoprotéica HO OH OH glicerol

(+ R1CO

2H + R2CO2H + R3CO2H)

ácidos graxos

ATP, Mg2+, glicerol quinase

HO OH

OPO3

2-O2, glycerol -3-phospate oxidase HO O OH 1,3-diidroxiacetona + Cl O glicerol-3-fosfato

H2O2

(29)

Nas análises de triglicerídeos, os principais interferentes são: ácido ascórbico (mesmo em baixas concentrações), bilirrubina (acima de 5mg dL-1), álcool, contraceptivos orais e estrógeno, além de luz direta.

1.3.3 Determinação de colesterol

Para análise do colesterol total, o mesmo é obtido a partir da hidrólise dos seus respectivos ésteres, mediada pela enzima colesterol esterase. O colesterol livre é oxidado via reação com oxigênio molecular em presença de colesterol oxidase, formando a colest-5-en-3-ona juntamente de peróxido de hidrogênio. Esse último, de forma idêntica à análise de glicose, leva a formação do cromógeno quinoneimina, com absorção máxima em 505 nm. O método é apresentado na Figura 9.

Figura 9 - Reações químicas envolvidas na determinação de colesterol através do método enzimático-colorimétrico.

Fonte: Autor.

Para dosagens individuais dos níveis de HDL e LDL, é realizada uma precipitação de todos os tipos de colesterol, através da reação com fosfotungstato e magnésio, exceto o HDL, que fica como sobrenadante, e é quantificado de forma similar ao método descrito na Figura 9. A concentração de LDL é determinada a partir da equação de Friedewald: LDL = colesterol total – (HDL + VLDL); sendo VLDL = triglicerídeos / 5.

O2, colesterol oxidase N N O NH2 + OH N N O N O peroxidase

ésteres de colesterol

colest-5-en-3-ona

4-aminoantipirina fenol quinonimina

(max = 500nm)

O H H H O R colesterol esterase colesterol HO H H H + O H H H

H2O2 peródixo de

(30)

Nas análises de colesterol, os principais interferentes são: ácido ascórbico (acima de 10 mg dL-1), hemoglobina (acima de 180 mg dL-1), bilirrubina (acima de 5mg dL-1) e lipemia (triglicerídeos acima de 2600 mg dL-1).

Os métodos enzimáticos colorimétricos empregados para determinação de glicose, triglicerídeos e colesterol, discutidos nos itens 1.3.1 até 1.3.3, ainda são considerados os mais importantes e utilizados nas análises clínicas rotineiras em laboratórios20, por serem bem estabelecidos e contemplarem características consideradas essenciais para o tipo de análise em questão: resposta rápida, exatidão/precisão, sensibilidade, estabilidade, além de medições com ampla abrangência dentro das faixas de concentrações dos analitos. Entretanto, tais métodos possuem desvantagens inerentes às suas aplicações. Das mais relevantes, podem ser citadas2,7:

i) Tempo de análise: em média, 25 minutos para determinação de cada analito, em uma única amostra;

ii) Influência de fontes de variação, especialmente, biológica e analítica: reagentes, interferentes, diferentes respostas metabólicas dos indivíduos;

iii) Necessidade de reagentes/equipamentos específicos (enzimas): essa questão naturalmente implica altos gastos para realização das análises. Por exemplo, na França, em 2007, determinações de glicose foram o terceiro tipo de ensaio clínico mais realizado nos laboratórios médicos, somando um total de aproximadamente 21 milhões de análises que representaram um custo de 42 milhões de euros para o sistema de saúde francês3.

iv) Geração de resíduos químicos provenientes das diversas etapas durante as reações químicas mediadas por enzimas e outros reagentes22;

v) Controle de temperatura: uma vez que tais reações enzimáticas devem ocorrer em temperatura de 36°C, simulando a temperatura corporal.

(31)

1.4 INFRAVERMELHO: a descoberta

A radiação no infravermelho (IR, do inglês,infrared) foi descoberta pelo astrônomo e

músico inglês, Frederik William Herschel, em 1800. Entre suas tentativas de descoberta do planeta Urânio, Herschel alcançou um resultado de relevância em um experimento que visava encontrar a contribuição individual das cores, provenientes da decomposição da luz solar, no aumento da temperatura de objetos expostos a tal radiação. Ao contrário do que se esperava, Herschel observou que, surpreendentemente, mesmo depois do fim da região visível de cor vermelha da luz dispersada, a temperatura do termômetro por trás dos objetos continuava subindo. Na realização do experimento, o cientista utilizou termômetros de bulbo negro e prismas de vidro transparentes à radiação IR, e publicou sua descoberta se referindo a tal

região como “raios caloríficos”. Posteriormente, a mesma foi nomeada como infravermelho,

usando o prefixo grego “infra” que significa “abaixo”. Dessa forma, então, foi determinada a primeira parte não visível do espectro eletromagnético23,24.

Em 1881, Abney e Festing foram os responsáveis pela obtenção do primeiro espectro no infravermelho próximo (NIR, do inglês, near infrared), utilizando líquidos orgânicos, na faixa de 1 até 1,2 m. Este trabalho foi de grande significância, não só por ser a primeira

medição NIR, mas também devido ao reconhecimento de grupos atômicos e da importância da ligação de hidrogênio,nos espectros NIR24. Entretanto, apesar de só ter sido descoberta depois, a região do infravermelho médio (MIR, do inglês, mid-infrared) ganhou rapidamente

muito mais aceitação, logo após os trabalhos desenvolvidos por Coblentz, em 1900, que verificou a utilidade da região MIR para identificação de grupos funcionais orgânicos. Durante a primeira metade do século 20, a maioria dos pesquisadores se dedicou a ampliar a base de dados de compostos orgânicos e atribuir características espectrais à presença de grupos funcionais específicos, em diversas moléculas23. A pesquisa na região do infravermelho próximo teve o comportamento oposto ao observado no MIR, devido ao fato de que muitos pesquisadores consideravam os espectros NIR muito confusos de interpretação, uma vez que os sinais registrados eram picos de fraca intensidade e muito sobrepostos entre si, resultados de vários sobretons e bandas de combinação.

Entretanto, a década de 1980 representa um marco para a utilização da técnica NIR, que até então, só constava de aproximadamente 255 trabalhos publicados. Tal fato foi claramente evidenciado na publicação de Wetzel, em 1983, que tinha o título sugestivo “Near

Infrared Reflectance Analysis - sleeper among spectroscopic techniques”, onde o autor

(32)

década de 80, o microprocessador passou a ser integrado no desenvolvimento de instrumentos eletrônicos, de forma que a aquisição, manipulação e interpretação de dados complexos, passou a ser feita de forma muito mais sofisticada, através de diversos programas computacionais. O resultado desse avanço tecnológico levou a um grande aumento no número de trabalhos realizados envolvendo a espectroscopia NIR. Na década de 90, listava-se mais de 1000 publicações, cujos títulos buscavam se adaptar à nova realidade vivenciada pela técnica, que, na época, passou a ser chamada de “estrela d‘alva da espectroscopia”24.

1.4.1 Espectroscopia no infravermelho próximo

A região do espectro eletromagnético correspondente ao infravermelho se estende na faixa de radiação, em número de onda, de aproximadamente 12800 a 10 cm-1. Esta, conforme apresentado na Tabela 1, é subdividida em três regiões distintas: infravermelho próximo (NIR), médio (MIR) e distante (FIR, do inglês, far infrared).

Tabela 1 - Regiões espectrais no infravermelho.

Região

Intervalo de número de onda (cm-1)

Região em comprimento de

onda (nm)

Região de frequência (Hz)

Próximo (NIR) 12800 – 4000 780 – 2500 3,8 x 1014– 1,2 x 1014 Médio (MIR) 4000 – 200 2500 – 5000 1,2 x 1014– 6,0 x 1012 Distante (FIR) 200 – 10 5000 - 100000 6,0 x 1012– 3,0 x 1011

Fonte: referência25.

(33)

1.4.1.1Principais características e aplicações

Métodos analíticos que se baseiam no uso da espectroscopia NIR se utilizam de suas mais relevantes características, tais como:

 Rapidez na obtenção de espectros (1 minuto ou menos, por amostra);

 Natureza não destrutiva;

 Natureza não invasiva, mas com alta penetração do feixe de luz (cerca de 1 a 3 mm);

 Quase universalidade em termos de aplicações (considerando que pode ser aplicada a quaisquer moléculas contendo as ligações C-H, N-H, O-H ou S-H);

 Mínima ou nenhuma preparação das amostras;

 Possibilidade de aplicações em linha (analisadores de processo);

 Determinações simultâneas (através de calibração multivariada);

Todavia, como toda técnica analítica, a espectroscopia NIR também possui limitações/desvantagens, das quais podem ser citadas, principalmente:

 A técnica não é muito sensível (limite de detecção 1%);

 Baixa seletividade;

 Em muitos casos, as bandas de combinação e sobretom da água podem ser mais intensas que os sinais referentes à ligação C-H em compostos orgânicos, o que prejudica a análise dessas substâncias em presença de água.

 Espectros de interpretação complexa, em função da natureza dos sinais observados (sobreposições e bandas de combinação).

(34)

quimiometria, que lidam de forma muito satisfatória com a alta complexidade dos espectros NIR e ampliam, ainda mais, a gama de aplicabilidade da técnica24,32.

1.4.1.2Instrumentação

Um espectrofotômetro NIR consiste principalmente da fonte de luz, do seletor de comprimentos de onda, do suporte para a amostra e do detector óptico, conforme ilustrado na Figura 10.

Figura 10 -. Componentes básicos de um equipamento que opera na região do infravermelho.

Fonte: Autor.

Cada um desses componentes pode ter propriedades e origens diferentes, de modo que se torna possível classificar os espectrofotômetros NIR de acordo com as características de seus constituintes33. Em relação à seleção de comprimentos de onda, os espectrofotômetros NIR de espectro contínuo incluindo um interferômetro e transformada de Fourier são, sem dúvidas, aqueles que contêm a combinação das melhores características em termos de precisão e exatidão na recuperação dos comprimentos de onda, alta relação sinal/ruído e rapidez nas varreduras, possibilitando a obtenção de espectros em um minuto, ou menos24.

1.4.2 Aspectos Teóricos da Espectroscopia NIR

Naturalmente, os átomos envolvidos em ligações químicas não estão localizados sobre posições fixas, uma vez que estão continuamente desenvolvendo movimentos vibracionais e rotacionais em torno de um eixo, ou átomo central. Basicamente, conforme visto na Figura 11, tais movimentos podem ser classificados como estiramentos ou deformações angulares, podendo, ambos, serem simétricos ou assimétricos.

(35)

central. Por outro lado, as vibrações por deformação angular consistem em movimentos que um átomo realiza e alteram o ângulo de ligação entre três átomos.

Figura 11-Tipos de movimentos vibracionais existentes em ligações químicas: a) estiramentos; b) deformações.

Fonte: Autor.

As vibrações por deformação angular podem ocorrer tanto no plano quanto fora do plano e, ainda, serem simétricas ou assimétricas, dependendo do sentido em que cada átomo esteja se movimentando26. Tais movimentos vibracionais (e também os rotacionais) podem acarretar em mudanças nos momentos dipolares das moléculas, de forma que, só assim, uma determinada radiação incidente, neste caso, a radiação NIR, poderá interagir com as mesmas e provocar mudanças nas amplitudes de suas vibrações e rotações. O tal momento dipolar é dependente da magnitude da diferença de carga entre os átomos (calculada através da eletronegatividade dos mesmos) e pela distância entre estes centros de carga. O campo elétrico produzido pelas vibrações ou rotações de átomos unidos por ligações químicas pode interagir com o campo elétrico da radiação incidente e, se as frequências de ambos forem as mesmas, então ocorrerá a absorção da radiação pela molécula.

simétrica assimétrica

a) vibrações de estiramento

balanço no plano recorte no plano

desvio fora do plano torção fora do plano

(36)

A frequência desses movimentos é definida pela força da ligação e massas individuais dos átomos ligantes. Já as amplitudes são de poucos nanômetros e poderão aumentar se alguma energia for transferida à molécula. Essa transferência pode ocorrer através de um

fóton de um dado comprimento de onda ( ), onde a energia (Ep) pode ser expressa como:

Ep = h = hc/

Onde h é a constante de Planck e c, a velocidade da luz.

Considerando uma molécula diatômica como duas massas esféricas (m1 e m2) unidas

por uma mola com constante de força (k), através do modelo do oscilador harmônico simples

e da Lei de Hooke, a energia (E) do sistema é dada por:

Onde é a massa reduzidaμ = m1m2 / m1 + m2

Considerando o clássico modelo do oscilador harmônico, a energia potencial (V) de uma vibração será função do afastamento dos átomos, sendo expressa por:

Apesar de útil para o entendimento do conceito de energia vibracional, tal abordagem é falha quando são considerados sistemas microscópicos, como no caso das moléculas, pelo fato de que tais sistemas não assumem perfis contínuos de energia, como seria previsto por esse modelo clássico. De acordo com a mecânica quântica, tais sistemas moleculares só podem assumir níveis discretos de energia (Eυ), definidos como:

Onde υ é o número quântico vibracional, Eυ é a energia associada com esse determinado nível quântico, é a frequência vibracional fundamental que, de acordo com o

modelo clássico, é dada por:

(1)

(2)

(3)

(37)

De acordo com esse modelo quântico/harmônico, as transições entre os diferentes

níveis vibracionais adjacentes só podem acontecer quando Δυ = ± 1. Ainda, essa diferença de

energia entre os níveis é sempre a mesma. E, para que uma molécula absorva energia e, consequentemente, seja promovida até um nível vibracional excitado, a radiação incidente deve corresponder exatamente à diferença entre os dois níveis energéticos adjacentes. Portanto, a energia do fóton deve ser:

ΔE = Eυ2– Eυ1 = h

Embora possa explicar a espectroscopia vibracional, o modelo harmônico, representado na Figura 12-A, apresenta certas limitações em relação ao entendimento dos sinais observados experimentalmente, através da espectroscopia NIR, uma vez que não são

permitidas transições com Δυ maior que 1.

Figura 12-Modelos harmônico (A) e anarmônico (B) para espectroscopia vibracional.

Fonte: adaptado da referência24.

Transições com Δυ ± 2 ou maior são proibidas pelo modelo harmônico/quântico e, portanto, muitos dos fenômenos observados (bandas de sobretons) na região NIR não existiram. Outro fator importante do modelo harmônico, é que todas as vibrações são independentes entre si, logo, as bandas de combinação NIR também não deveriam ser

Potencial harmônico Potencial anarmônico

Distância interatômica

E

ne

rg

ia

p

ot

en

ci

al

(U

)

(5)

(38)

observadas. Todavia, tanto as bandas de combinação quanto os sobretons existem e são experimentalmente visualizados, na região NIR25.Para contornar tais restrições, um modelo mais realístico foi proposto, onde uma molécula diatômica ainda é tratada com a aproximação

de duas “bolas” unidas por uma “mola”, entretanto, o novo modelo considera, agora, alguns comportamentos não ideais do oscilador, tais como: as forças de repulsão entre as nuvens eletrônicas à medida que os átomos se aproximam e a energia de dissociação, que prevê que quando os átomos estão a uma distância muito grande a ligação química passa a não existir mais.

Esse comportamento anarmônico é aproximado através da equação de Morse24, que descreve a energia potencial da molécula diatômica, como:

Onde a é uma constante molecular, De é a energia de dissociação, reé a distância

interatômica de equilíbrio e r é a distância interatômica a um dado instante.

Aplicando a mecânica quântica à função de Morse, a equação resultante descreve os níveis vibracionais, como:

Em que xm é a constante de anarmonicidade da vibração.

Dessa forma, o modelo anarmônico/quântico, ilustrado na Figura 12-B, explica a ocorrência de transições com Δυ ± 2 ou maior (sobretons) e bandas de combinação entre vibrações, que são, ambos, os tipos de bandas com maior predominância na região espectral NIR. Outra contribuição importante é que o modelo prevê que a separação entre dois níveis

vibracionais adjacentes diminui com o aumento do número quântico vibracional, υ, não sendo

mais igualmente espaçadas, como previa o modelo harmônico.

Dessa forma, a energia total vibracional () é resultante da interação entre diferentes níveis e

pode ser calculada como:

(7)

(8)

(39)

A anarmonicidade também pode estar presente nas propriedades elétricas das moléculas. Especificamente, isso irá afetar no momento de dipolo, que em um modelo anarmônico, não tem dependência linear com a distância interatômica. Esse tipo de anarmonicidade pode fornecer caminhos para ocorrência de sobretons e bandas de combinação, mesmo se nenhum desvio mecânico do modelo harmônico for observado no sistema em questão, tornando os espectros NIR ainda mais complexos25.

1.5 QUIMIOMETRIA E CALIBRAÇÃO MULTIVARIADA

A quimiometria pode ser definida como a utilização de conceitos matemáticos e estatísticos, visando planejar e selecionar procedimentos experimentais otimizados, bem como obter o máximo de informações químicas, a partir de um conjunto de dados. O seu desenvolvimento e utilização é fortemente relacionado ao uso de computadores em laboratórios químicos. Na década de 1970, muitos pesquisadores já utilizavam matemática e estatística em seus experimentos, entretanto, a quimiometria só se firmou à medida que os sistemas computacionais passaram a ser aprimorados, de forma que a aquisição e manipulação dos mesmos passou a ser mais simples e comum, tornando-os mais acessíveis a pesquisadores de diversas áreas, especialmente, na química analítica34,35. Essa maior disponibilidade em relação aos computadores, bem observada a partir dos anos 1980, proporciona uma nova era para a aquisição, processamento e interpretação de dados químicos, através de métodos estatísticos e matemáticos aliados a programas computacionais, uma vez que essa união possibilita aos pesquisadores trabalharem com informações de natureza complexa e também a busca pelo desenvolvimento de novos métodos34. Em virtude de sua vasta aplicabilidade, a quimiometria foi dividida em diversas áreas, das quais podem ser citadas:

 Processamento de sinais analíticos;

 Planejamento e otimização de experimentos;

 Reconhecimento de padrões e classificação de dados;

 Calibração multivariada;

 Métodos de inteligência artificial.

(40)

A calibração multivariada provavelmente é uma das áreas da quimiometria que tem atraído mais atenção36,37. Calibração pode ser definida como operações que visam estabelecer uma relação entre respostas e fatores, ou, por exemplo, entre medidas instrumentais e uma propriedade de interesse34,37. A clássica calibração univariada é muito bem estabelecida na química analítica e, para um modelo linear, trata-sede uma função matemática que relaciona os grupos das variáveis dependentes (Y) e independentes (X) da seguinte forma:

Y = b0 + b1X

Em que “b” representa os coeficientes da equação e X trata-se de medidas instrumentais realizadas em um determinado comprimento de onda, , como, por exemplo, um valor de absorbância, A.

Entretanto, é preciso certificar-se de que as medidas realizadas sobre um dado comprimento de onda não sejam afetadas por sinais de outras fontes (interferentes), além daquela de interesse (analito), para que os resultados fornecidos pelo modelo univariado sejam exatos e confiáveis. Para medidas analíticas que não apresentam alta seletividade em seus sinais, a calibração univariada deve apresentar resultados muito desviados do valor real36. A espectroscopia NIR é uma das técnicas analíticas que apresenta baixa seletividade em seus sinais, devido à complexidade inerente dos mesmos, por serem oriundos de sobretons e bandas de combinação de vários tipos de ligações químicas envolvidas nas diversas moléculas presentes na amostra. Dessa forma, normalmente não é possível se utilizar apenas um comprimento de onda para a determinação da concentração, por exemplo, de um parâmetro de interesse. Esse problema pode ser ilustrado através da Figura 13, onde a concentração de gorduras em 103 amostras de carne bovina e suína foi determinada, individualmente, pelos métodos univariado (Fig. 13-b) e multivariado (Fig. 13-c), através dos espectros NIR (Fig. 13-a), obtidos na faixa de 850 a 1050 nm, resultando num total de 100 variáveis:

(41)

Figura 13 -Comparação entre métodos univariado (b) e multivariado (c) para análise de gordura a partir de espectros obtidos na região do NIR (a).

Fonte: adaptado da referência36.

A calibração univariada utilizou apenas as medidas instrumentais a 940 nm, que corresponde ao terceiro sobretom do grupo CH2. A melhor correlação obtida por este método

foi de 0,23, sendo um valor bastante insatisfatório. Por outro lado, quando foi aplicada a calibração multivariada neste conjunto de dados, utilizando todas as 100 variáveis espectrais, o valor do coeficiente de correlação aumentou significativamente para 0,97, evidenciando que, em muitos casos, a combinação de informações provenientes de muitas ou até mesmo todas as variáveis espectrais é muito mais vantajosa36. Além do aproveitamento da informação química útil fornecida por cada uma das variáveis espectrais, a calibração multivariada também apresenta outras vantagens de grande importância para métodos analíticos, tais como a possibilidade de construir modelos mesmo na presença de interferentes, desde que os

Comprimento de onda (nm) Referência de gordura (% de peso)

Pr edi çã o de g or du ra ( % d e p es o)

Referência de gordura (% de peso)

(42)

mesmos encontrem-se também na fase de calibração e não somente na previsão de novas amostras, além da possibilidade de determinações simultâneas em uma única análise38.

Um modelo linear multivariado pode ser representado como uma função matemática que representa a relação entre X e Y, da seguinte maneira36:

Onde K representa o número de variáveis presentes na equação e f, os resíduos.

Neste tipo de calibração as medidas (respostas) instrumentais X são representadas em forma de matriz, enquanto a propriedade de interesse Y, que é determinada por uma metodologia padrão, é representada por um vetor39. A Figura 14mostra um exemplo da construção de uma matriz de respostas instrumentais.

Figura 14- Ilustração esquemática de construção de uma matriz de respostas instrumentais.

Fonte: Autor.

Diversos são os métodos de regressão atualmente empregados na calibração multivariada. Dentre os mais utilizados para modelagem linear estão as regressões em componentes principais (PCR, do inglês, principal component regression) e por mínimos

quadrados parciais (PLS, do inglês, partial least squares). Por sua vez, as redes neurais

artificiais (ANN, do inglês, artificial neural network), os mínimos quadrados parciais não

lineares (N-PLS) e as máquinas de vetores de suporte (SVM, do inglês, support vector

(43)

machine) tem aplicação de destaque como métodos multivariados de regressão não linear

[35].

Outra área da quimiometria que apresenta grande destaque, além da calibração multivariada, é o reconhecimento de padrões que pode ser aplicado com diversas finalidades, especialmente na análise exploratória de dados e classificação de objetos. Uma vez que as respostas instrumentais carregam informações químicas e físicas das amostras, a análise exploratória é usada para detecção de padrões de associação nos conjuntos de dados e, a partir destes padrões, é possível se estabelecer relações entre as amostras e variáveis, descobrir amostras anômalas (outliers) ou agrupa-las conforme determinadas características35,40. Para

tanto, um dos métodos mais utilizados é a análise por componentes principais (PCA, do inglês, principal component analysis) que tem como maiores objetivos reduzir a

dimensionalidade do conjunto de dados e colinearidade existente entre as diversas variáveis instrumentais, preservando, ao mesmo tempo, o máximo de informação útil à análise36,37. O conjunto de dados resultante da PCA é muitas vezes utilizado como base para construção de diversos modelos multivariados e fornecem resultados mais satisfatórios quando comparados àqueles obtidos através do conjunto de dados originais. Dessa forma, a fundamentação envolvida nos cálculos da PCA é inerente a muitos métodos multivariados, sejam eles de regressão ou classificação36.

1.5.1 Análise por componentes principais – PCA

O princípio geral da PCA é realizar uma aproximação da matriz original das respostas instrumentais (X) como um produto de duas outras matrizes, de menores dimensões, os scores

e loadings. Essa transformação é realizada da seguinte maneira34,41:

Onde:

X é a matriz de dados originais,

T é a matriz dos scores;

P é a matriz dos loadings;

E é a matriz residual;

T é a matriz transposta.

(44)

Na projeção de X no subespaço d-dimensional,conforme mostrado na Figura 15, os

scores representam as coordenadas das amostras no sistema definido pelas componentes

principais (PC, do inglês, principal component). Os loadings são os cossenos dos ângulos dos

vetores de direção da variabilidade das amostras (componentes principais). Por sua vez, a matriz residual representa a quantidade de informação espectral que não foi descrita através das componentes principais41.

Figura 15 - Projeção de X no espaço d-dimensional.

Fonte: referência33.

A matriz obtida pela PCA, descrita pelas componentes principais, contém novas variáveis que não são correlacionadas entre si. Cada PC carrega informações diferentes sobre as amostras e variáveis originais, e são calculadas através de um processo iterativo, em que a equação (12) é usada para extrair o primeiro termo T1P1T (PC1)da matriz X. A matriz residual

E é submetida ao mesmo cálculo para a obtenção de T2P2T (PC2), dando origem a uma nova

matriz residual que, por sua vez, contém menos informação. Esse processo se repete até que a matriz residual contenha uma quantidade de informação comparável ao nível de ruído instrumental41. Desse modo, a maior parte da variabilidade presente no conjunto de dados estará contida na primeira PC; a segunda PC terá mais informação que a terceira, e assim por diante34.

Um aspecto importante para qualquer método de compressão de dados, como a PCA, é a escolha do número ótimo de variáveis ou componentes que deve ser usado. Se muitas componentes são selecionadas, muita redundância das variáveis de X será incorporada no modelo, ocasionando o sobreajuste do mesmo (overfitting). Por outro lado, se for usada uma

(45)

Figura 16 - Fatores influentes na escolha do número de componentes.

Fonte: adaptado da referência36.

Conforme é visto através da Figura 16, dois fatores devem ser considerados para que seja feita a escolha certa do número de componentes a se utilizar: o erro do modelo e a estimativa de erro (“simulação de erro para novas amostras”). À medida que o número de componentes aumenta, o erro do modelo diminui, uma vez que uma maior variabilidade de X é contemplada. Ao contrário, a estimativa de erro cresce em função do aumento de parâmetros a serem estimados. Portanto, o número ideal de componentes a ser utilizado deve encontrado no ponto médio entre os valores máximos do erro e estimativa de erro do modelo multivariado36.Um dos métodos mais utilizados para seleção do número correto de componentes (ou fatores) a ser selecionado é chamado de validação cruzada (CV, do inglês,

cross validation). Esta técnica consiste em calcular uma estimativa de erro que o modelo

multivariado apresentaria frente a novas amostras desconhecidas para previsão de um parâmetro de interesse. Para tanto, são utilizadas as próprias amostras de calibração, e suas respectivas respostas instrumentais, que foram usadas na construção do modelo. O método de validação cruzada leave-one-out realiza esse cálculo deletando uma amostra por vez, e

calculando o modelo na sua ausência.A habilidade de previsão deste modelo é, então, testada utilizando a amostra que foi mantida fora da construção do mesmo. Este procedimento é repetido até que todas as amostras de calibração disponíveis tenham sido excluídas uma vez e reincorporadas no modelo, individualmente. A estimativa de erro é dada pela raiz quadrada do erro médio de validação cruzada (RMSECV, do inglês, root mean square error of cross

validation), que é definido como:

Número de componentes

E

rr

o

de

p

re

di

çã

o

Underfitting Overfitting

Imagem

Figura 1 - Formas estruturais da glicose no sangue e suas respectivas proporções.
Figura 2 - Estrutura genérica de um triglicerídeo e exemplos de ácido graxos.
Figura 4- Representação das espécies constituintes de uma lipoproteína de baixa densidade (LDL)
Figura 5 -Ilustração comparativa das espécies constituintes das estruturas do HDL e do LDL
+7

Referências

Documentos relacionados

que os melhores resultados foram obtidos para a estratégia de entrada por rolagem, quando comparadas às duas estratégias com os mesmos parâmetros de corte, para

Desse modo, com o objetivo de identificar, no ensino musical, alguns professores, instrumentos e locais de ensino na cidade do Rio de Janeiro desse período,

Today we are aware that t he sheep and goat roduction syste ms, organized in s mall production unit s are a fundamental part of the dev e l opment of 1ounta in areas.

Os pontos de discussão abaixo foram desenvolvidos para facilitar a discussão com um coach com certificação no Hogan ou com quem fornece o feedback, para explorar os resultados

considerar que, na atividade de carvoejamento, omodelo de gestão praticado tem características do modelo clássico, cujos indicadores são: regras organizacionais baseadas em

Using the 10 cm³ volume of the field as a parameter, we observed at the harvesting point, the lettuces showed a height of 14.25 cm (Figure 1 E), being smaller in 7.55 cm for the

Conforme abordado na seção 3.4 o modelo da Lei das Potências (Power Law) é o indicado para análise de dados de confiabilidade para este tipo de equipamento

RESUMO A pesquisa intitulada “Educação Infantil, criança e docência: concepções em relatórios de estágio dos estudantes de pedagogia da UFAL” 2009-2017 se trata de um