INTRODU
INTRODU
Ç
Ç
ÃO
ÃO
À
À
CALIBRA
CALIBRA
Ç
Ç
ÃO
ÃO
MULTIVARIADA
MULTIVARIADA
APLICA
APLICA
Ç
Ç
ÃO NO CONTROLE DE QUALIDADE
ÃO NO CONTROLE DE QUALIDADE
DE F
DE F
Á
Á
RMACOS
RMACOS
Prof. Dr. Marcelo Martins de Sena
MÓDULO 06
1 Unidade Universitária de Ciências Exatas e Tecnológicas
MÓDULO 06
2
PLS
PLS
Partial
Partial
Least
Least
Squares
Squares
(M
(M
í
í
nimos Quadrados
nimos Quadrados
Parciais)
Parciais)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
PLS
PLS
3
⇒
É o método de calibração variada mais usado em
Química
⇒
Proposto por H. Wold nos anos 60 (Econometria)
⇒
Introduzido na Química por S. Wold e H. Martens
no começo dos anos 80
⇒
Semelhante ao PCR, mas decompõe os dados das
variáveis independentes (X) juntamente com os dados
das variáveis dependentes (Y)
⇒
Variável Latente, ao invés de Componente Principal
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Decomposi
Decomposi
ç
ç
ão dos Dados
ão dos Dados
4
• A PCA é aplicada nas duas matrizes de dados
(espectros, X, e concentrações, Y) simultaneamente
• Uma relação linear é estabelecida entre os
escores dos dois blocos:
X = TP’ + E
Y = UQ’ + F
u
h= b
ht
h, para “h” VL
s• Ocorrem mudanças em t e u até que se
encontre o melhor modelo linear entre eles
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Decomposi
Decomposi
ç
ç
ão dos Dados
ão dos Dados
5
X
=
T
n
p
n
E
+
n
p
P
p
h
h
U
=
Y
n
m
n
+
Q
m
h
h
F
n
m
X = espectros, n amostras e p λs; T = escores, P = pesos e E = resíduos
Y = concentrações, n amostras e p substâncias; U = escores, Q = pesos e F = resíduos
h Variáveis Latentes
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Decomposi
Decomposi
ç
ç
ão dos Dados
ão dos Dados
6 u x2 x2 CP1 X CP1 y1 y2 y x1 t
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Decomposi
Decomposi
ç
ç
ão dos Dados
ão dos Dados
7
• No PLS existe um compromisso entre a
explicação da variância em X e encontrar a
correlação com Y.
x3 VL1
y
•Leve rotação no eixo da CP para aumentar a correlação com y.
•Chama-se Variável Latente (VL).
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
PLS1 e PLS2
PLS1 e PLS2
8
⇒ PLS1:
Uma variável dependente é prevista de
cada vez
- y é um vetor
⇒ PLS2:
Várias variáveis dependentes são
previstas simultaneamente no mesmo modelo
- Y é um matriz
⇒ O número após o PLS indica a dimensão do
arranjo de dados das variáveis dependentes
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
ALGORITMOS
ALGORITMOS
-
-
PLS
PLS
9
1) NIPALS: Non-linear iterative partial least squares
- Baseado no cálculo de uma VL de cada vez, a qual vai sendo subtraída dos dados.
- É o mais usado.
2) SIMPLS: proposto por S. de Jong (Chemolab 18:251,
1993).
- Os dados são decompostos em uma única etapa, baseada em uma operação de autovetores. - É mais rápido e mais simples de interpretar
Na prática, a diferença entre os 2 algoritmos é insignificante
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Dimensionalidade dos
Modelos PLS/PCR
10
⇒
É fundamental determinar o número correto de
variáveis latentes (ou componentes principais)
⇒
Subajuste: VL
s/CP
sde menos são usadas.
Informação relevante é deixada fora do modelo
⇒
Sobreajuste: VL
s/CP
sde mais são usadas.
Informação irrelevante (ruído) é incluída no modelo
⇒
Realiza-se uma avaliação dos modelos construídos
com diferentes números de VL
s(ou CP
s):
Validação Cruzada
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
VALIDA
VALIDA
Ç
Ç
ÃO CRUZADA
ÃO CRUZADA
11
⇒
Cross Validation
⇒
Separa-se uma parte (ou apenas uma) das
amostras de calibração e constrói-se o modelo com
as restantes.
⇒
Estima-se os erros de previsão para as amostras
que foram separadas, utilizando diferentes números
de VL
s⇒
Esse processo é repetido para outras amostras,
até que todas tenham ficado de fora
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
VALIDA
VALIDA
Ç
Ç
ÃO CRUZADA
ÃO CRUZADA
12
⇒
Vários tipos dependendo de como a amostra, ou o
subconjunto de amostras, é retirada dos dados
⇒
Leave-one-out: mais usada
Uma amostra é retirada de cada vez
⇒
Blocos contínuos (Contiguous Blocks) e
Subconjuntos aleatórios (Random Subsets): usadas
em grandes conjuntos de dados
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
VALIDA
VALIDA
Ç
Ç
ÃO CRUZADA
ÃO CRUZADA
13
Leave-one-out
Modelo previsão. . . . . .
. . .
X X Y Y 1ˆy
nyˆ
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
VALIDA
VALIDA
Ç
Ç
ÃO CRUZADA
ÃO CRUZADA
14
Escolha do n
ode VL
s 0 5 10 15 20 25 0.34 0.36 0.38 0.4 0.42 0.44 0.46 0.48 0.5 0.52 0.54Número de Variáveis Latentes
R M SEC V ( o ) RMSECV vs. VL 5
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Planejamento de Calibra
Planejamento de Calibra
ç
ç
ão
ão
15
⇒
Duas considerações importantes:
1)
O conjunto de calibração deve ser representativo
da população para a qual as futuras previsões
serão feitas
2)
As amostras de calibração devem estar
distribuídas ao longo de todo o espaço amostral:
- Conjunto de calibração controlada
- Conjunto de calibração natural
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Planejamento de Calibra
Planejamento de Calibra
ç
ç
ão
ão
16
1)
Calibração controlada:
é possível e recomendável
realizar um planejamento experimental.
→
Situação usual no controle de qualidade de
fármacos
2)
Calibração natural:
a composição das amostras não
é controlada.
Ex: Determinação do teor de matéria orgânica em
amostras de solo
→
Usa-se algum método p/ encontrar as amostras
mais representativas (Ex: Kennard-Stone, PCA)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Planejamento de Calibra
Planejamento de Calibra
ç
ç
ão
ão
17
Planejamentos Fatoriais para 3 fatores (3 analitos)
2 níveis para cada fator 23 amostras
3 níveis para cada fator 33 amostras
Planejamento composto central
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Planejamento de Calibra
Planejamento de Calibra
ç
ç
ão
ão
18
Algoritmo de Kennard-Stone
⇒ Inicia-se com a seleção de 2 espectros: aquele mais próximo
do ponto central (ou mais distante) e outro que possui a maior distância euclidiana em relação ao primeiro.
⇒ Estas 2 amostras são removidas do conjunto de calibração X
e colocadas em um subgrupo denominado T.
⇒ Para cada espectro não selecionado de X, as distâncias
euclidianas (dj) entre o espectro selecionado que está no
subconjunto T e os espectros restantes são computadas.
⇒ A amostra de X com maior valor de dj é selecionada para o
subconjunto T. O procedimento segue até a obtenção do número desejado de amostras.
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Planejamento de Calibra
Planejamento de Calibra
ç
ç
ão
ão
19
Exemplo de Kennard-Stone:
- Determinação de octanagem em gasolina
- Seleção de 9 amostras num conjunto de 54 espectros
- Início com o espectro mais próximo da média
Amostras selecionadas: 44, 10, 30, 2, 40, 16, 21, 51, 38
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Planejamento de Calibra
Planejamento de Calibra
ç
ç
ão
ão
20
Aspectos importantes:
⇒
Incluir na calibração tipos importantes de
variabilidade sistemática, como
interferências
, de
modo que possam ser modeladas de maneira
satisfatória
⇒
Muitas vezes é necessário um grande conjunto de
calibração para explicar todas as possíveis
variações das amostras. No IV, recomenda-se
6(VL
s+1) amostras (ASTM)
⇒
Minimizar os efeitos de ruídos aleatórios de várias
origens
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Planejamento de Calibra
Planejamento de Calibra
ç
ç
ão
ão
21
⇒
Escolha das variáveis:
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
1)
Variáveis do Bloco Y (Medidas de referência)
- Importante conhecer o nível de ruído esperado, levando em conta a amostragem, a preparação e a técnica analítica.
- O nível de ruído pode ser estimado a partir de experimentos anteriores, considerações teóricas ou por medidas em replicata.
2)
Variáveis do Bloco X (Espectros)
- Importante escolher quais variáveis devem ser incluídas no modelo (qual parte do espectro).
- Sinal do analito deve ter intensidade suficiente, com alta razão sinal/ruído.
- Os sinais do analito e dos interferentes devem ser suficientemente diferentes.
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
22
Diagn
Diagn
ó
ó
sticos dos Modelos PLS/PCR
sticos dos Modelos PLS/PCR
⇒ Desempenho de previsão:
→Validação Interna:
- Previsão dos mesmos dados do conjunto de
calibração.
- Validação “viciada”, que por si só não garante o
bom desempenho do modelo
→ Validação Externa:
- Previsão de um conjunto de dados não usado na
construção do modelo (conjunto de validação)
23
Diagn
Diagn
ó
ó
sticos dos Modelos PLS/PCR
sticos dos Modelos PLS/PCR
⇒ Desempenho de previsão: parâmetros
→ RMSEP: Root Mean Square Error of Prediction
P/ o Conjunto de Validação
(
)
n y y RMSEP p r 2 ˆ − =→ RMSEC: Root Mean Square Error of Calibration
P/ o Conjunto de Calibração
(
)
gl n y y RMSEC p r − − = 2 ˆgl = no de graus de liberdade = no de VLs + 1 p/ dados centrados na média
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
24
Diagn
Diagn
ó
ó
sticos dos Modelos PLS/PCR
sticos dos Modelos PLS/PCR
→ Vetores de Regressão- Constituem o modelo matemático - Um vetor b p/ cada variável prevista
→ Pesos (loadings)
- Importância das variáveis originais na determinação do
novo espaço das VLs/CPs
→ Escores
- Posição das amostras/objetos no novo espaço
→ Porcentagem de variância explicada em X e em Y
Vetores de Regressão
Vetores de Regressão
25
Ex: Previsão de Dipirona no NIR
1100 1200 1300 1400 1500 1600 1700 1800 1900 -6 -4 -2 0 2 4 6 8 comprimento de onda (nm) C o ef ic ientes de regres s ã o Partes do espectro que mais contribuem
p/ a previsão do modelo
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Pesos (
Pesos (
Loadings
Loadings
)
)
26
Ex: Previsão de Dipirona no NIR
- Partes do espectro que mais contribuem
p/ cada VL 1100 1200 1300 1400 1500 1600 1700 1800 1900 -0.12 -0.1 -0.08 -0.06 -0.04 -0.02 0 0.02 0.04 Comprimento de onda (nm) P e s o s ( L oadi ngs ) na V L 1 - Semelhança com os espectros das espécies puras
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Variância Explicada
Variância Explicada
27
⇒
Em dados espectrais, espera-se uma alta
percentagem de variância explicada, tanto em X
como em Y (muitas vezes mais de 99 %)
Ex: Previsão de Dipirona no NIR
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Escores
Escores
28
⇒ Cada ponto representa uma amostra
⇒ É possível detectar erros nas amostras em experimentos planejados
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
-5 -4 -3 -2 -1 0 1 2 3 4 -2 -1.5 -1 -0.5 0 0.5 1 1.5 1 2 3 4 5 6 7 8 9 LV1 LV 2 Gráfico de Escores Ex: Determinação de AAS e Vitamina C no UV
29
Diagn
Diagn
ó
ó
sticos dos Modelos PLS/PCR
sticos dos Modelos PLS/PCR
⇒ Diagnósticos para não linearidades
→ Gráficos de t (escores) vs y (ou u p/ vários y
s)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
30
Diagn
Diagn
ó
ó
sticos dos Modelos PLS/PCR
sticos dos Modelos PLS/PCR
⇒ Leverage (h
i)
É uma medida da influência de uma amostra ou
variável no modelo, em comparação com o resto do
conjunto de dados
⇒ Resíduos
É uma medida da parte da informação da amostra
ou variável que não foi modelada (“quanto ficou de
fora do modelo”)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
31
Leverage
Leverage
⇒
Fornece a posição das observações das variáveisindependentes (X) umas em relação às outras no espaço das h-variáveis latentes.
BAIXO
BAIXO LEVERAGE:LEVERAGE amostra perto do centro do conjunto de calibração, com pouca influência no modelo.
ALTO
ALTO LEVERAGE:LEVERAGE amostra distante da média e que tem grande influência no modelo.
Alto leverage pode indicar uma amostra que naturalmente tem grande influência no modelo, fruto do planejamento experimental, ou pode indicar uma anomalia (outlier), fruto de erros.
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
32
Leverage
Leverage
Amostras
Ex: determinação de octanagem em gasolinas
)
/
(
1 ' 2∑
==
A a ia a a it
h
t
t
Amostra com alta Leverage escore amostra i escores da calibraçãoProf. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
33
Leverage
Leverage
Variáveis
- A amostra 22 é um possível outlier.
- Vamos ver as regiões do espectro responsáveis por isso:
variáveis com alto levarage
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
34
Leverage
Leverage
Amostras
-O leverage pode refletir o planejamento experimental - Ex: Determinação de AAS e Vitamina C no UV
1 2 3 4 5 6 7 8 9 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 Amostras Lev e rage
35
Res
Res
í
í
duos
duos
→
Resíduos podem ser utilizados para identificar amostras,variáveis ou simples pontos que foram mal modelados.
E = X – 1xm – TP’ (resíduos da calibração)
e = x – xm – tp (resíduo para cada amostra)
→
Altos valores de resíduos para amostras indicam possíveisanomalias (interferentes, ruídos instrumentais ou erros na medida).
→
Altos valores de resíduos para variáveis podem serinterpretados como ruídos nestas variáveis em uma ou mais amostras.
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
36
Res
Res
í
í
duos
duos
⇒ Desvio padrão residual total
→
Variação média dos pontos em torno do modelorepresentados pelas VLs/CPs:
df = (p-k)(n-k-1) → número de graus de liberdade, onde “p” é o
no de variáveis, “k” o no de VLs/CPs, e “n” o no de amostras.
⇒
⇒
Representa a distância típica entre o modelo
(VLs/CPs) e as amostras
∑∑
=
e
df
S
i2k/
, 2 0Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
37
Res
Res
í
í
duos
duos
→ Variação média deste objeto em relação ao modelo:
→ Proporcional à distância entre o ponto que representa
esta amostra e o modelo de componentes principais.
⇒ Desvio padrão residual p/ uma amostra
∑
− − − = 2 /( /( )( 1)) 2 e n p k n k sp k objeto p sp Modelo -Se sp2 > S 0 → amostra diferente-Teste F para verificar semelhanças entre as variâncias
PC
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
38
Res
Res
í
í
duos
duos
Resíduos p/ amostras
Ex: determinação de octanagem em gasolinas
Alto valor de resíduo Valor normal dos resíduos da população (Limite de 95% de confiança)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
39
Res
Res
í
í
duos
duos
Resíduos p/ variáveis
Altos resíduos para variáveis 330 a 400
Altos resíduos para variáveis 100 a 150
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
40
Detec
Detec
ç
ç
ão de
ão de
Outliers
Outliers
→
De fundamental importância
→
Outlier = Amostra anômala
→
Erros e fenômenos inesperados são inevitáveis
→
Fontes de anomalia na calibração:
- Erros do operador
- Ruído nos dados
- Problemas instrumentais
- Objetos anormais
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
41
Detec
Detec
ç
ç
ão de
ão de
Outliers
Outliers
→
Anomalias devem ser eliminadas ou corrigidas→ Em certos casos, a presença de anomalias pode fornecer
informações importantes sobre o sistema
→ Pode-se ter amostra, variável ou elemento anômalo:
- Amostra diferente das demais (alta ou baixa
concentração) ou erro na medida;
- Problema num dado comprimento de onda;
- Ruído durante uma medida específica, afetando apenas aquele espectro.
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
42
Outliers
Outliers
na Calibra
na Calibra
ç
ç
ão e na Previsão
ão e na Previsão
→ Durante a calibração é importante identificar (eliminando ou
corrigindo) as anomalias para que o modelo possa ser o melhor possível (BOA HABILIDADE DE PREVISÃO).
→ Durante a previsão de amostras desconhecidas é
importante possuir métodos capazes de detectar anomalias para aumentar a confiança nos resultados de previsão.
→ Às vezes, uma amostra anômala pertence a uma outra
categoria/classe.
AMOSTRAS DE CALIBRAÇÃO COM SIMULTANEAMENTE ALTOS LEVERAGES E ALTOS RESÍDUOS SÃO FORTES
CANDIDATAS A OUTLIERS
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
43
PREVISÃO
PREVISÃO
Gráfico dos valores de referência vs valores previstos
Previsão do conjunto de validação: 30 novos espectros de amostras de gasolina
Coeficiente de correlação: r= 0.998
Equação do modelo: y = 0.099 + 0.99 x
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
44
PR
PR
É
É
-
-
TRATAMENTO DOS DADOS
TRATAMENTO DOS DADOS
⇒
Dados espectrais são usualmente
centrados na
média
, mas não costumam ser autoescalados
⇒
Outros pré-tratamentos comuns:
-
Normalizações: divisão dos espectros por
constantes
- Alisamentos (smoothing): visa reduzir o ruído
nos espectros, através de filtros digitais
- Correções de linha base: 1ª e 2ª derivadas,
MSC, SNV
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Filtros Digitais
Filtros Digitais
45
⇒
Assume-se que os ruídos tem alta frequência em
relação ao sinal de interesse
→ Tipos:
- Filtros de média móvel
- Filtros baseados na Transformada de Fourier (FT)
- Filtros polinomiais: Savitsky-Golay
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Filtros Polinomiais
Filtros Polinomiais
46
→ Escolhe-se o tamanho de uma janela de pontos
→ Ajusta-se um polinômio aos pontos
→ Substitue-se o valor do ponto em questão pelo valor dado
pelo polinômio
Valor suavizado
→ Janela pequena demais: alisamento insuficiente
→ Janela grande demais: distorção do sinal analítico
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Filtros Polinomiais
Filtros Polinomiais
47
Exemplo
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Filtros Polinomiais
Filtros Polinomiais
48
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
0 10 20 30 40 50 60 70 80 90 100 0 0.02 0.04 0.06 0.08 0.1 0.12
0.14 Gaussiana sem ruído
0 10 20 30 40 50 60 70 80 90 100 0 0.02 0.04 0.06 0.08 0.1 0.12
0.14 Gaussiana com ruído
0 10 20 30 40 50 60 70 80 90 100 0 0.02 0.04 0.06 0.08 0.1 0.12
Corre
Corre
ç
ç
ões de Linha Base
ões de Linha Base
49
→ Extração de Offset : subtrai-se de cada variável do
espectro um único valor (1a variável) ou a média de uma
faixa de variáveis.
→ Modelagem Explícita: ajusta-se uma função ao espectro (polinômio de 1º ou 2º grau) que é usada para subtração dos dados espectrais (detrend).
→ Derivadas (1ª ou 2ª): correção de desvios lineares
→ Correção de espalhamento multiplicativo (MSC) e
Standard Normal Variate (SNV): correção de desvios não
lineares (drifts)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Corre
Corre
ç
ç
ões de Linha Base
ões de Linha Base
50
Espectros Originais
Após a 1a. derivada
⇒ Possível amplificação de ruídos (recomendável o uso
simultâneo de alisamento)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Corre
Corre
ç
ç
ões de Linha Base
ões de Linha Base
51
MSC (Multiple Scatter Correction): remove variação no
espectro causada por espalhamento de luz pelas amostras (típica em medidas de refletância difusa) BASE DO MÉTODO :
1. Espectro médio xm é calculado a partir do
conjunto de calibração
2. Para cada espectro individual xi os parâmetros ai
e bi são estimados por regressão
xi
xm
xi = ai + bixm
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Corre
Corre
ç
ç
ões de Linha Base
ões de Linha Base
52
⇒ Correções do espectro: xi = ai + xmbi
xi,corr = (xi-ai)/bi Observações :
1. Ajuste do intercepto pela movimentação da linha ao longo das ordenadas até que fique zero,
2. Rotação da linha até que alcance a linha do espectro médio (ou inclinação igual a 1)
a
b
Ajuste do offset Correção da inclinação
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Corre
Corre
ç
ç
ões de Linha Base
ões de Linha Base
53
Exemplo MSC
Espectro Original
Após MSC
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Varia
Varia
ç
ç
ões do PLS
ões do PLS
54
→ iPLS: PLS em intervalos
→ biPLS e siPLS: Variações do iPLS → PLS não linear
→ PLS Multilinear (Nway-PLS): para dados multidimensionais
→ PLS-DA: usado em análise discriminante/classificação
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena
Agradecimentos
Agradecimentos
55
Prof. Dr. Ronei J. Poppi
(IQ/UNICAMP)
Prof. Dr. Marcelo Martins de Sena Prof. Dr. Marcelo Martins de Sena