QUÍMICA ANALÍTICA AVANÇADA – 1S 2015
MÓDULO 2
3ª aula
Estatística
- Conceitos básicos
Prof. Rafael Arromba de Sousa
Departamento de Química - ICE
rafael.arromba@ufjf.edu.br
Estatística Aplicada à Química Analítica
Aula 2:
- Conceitos e definições básicos
Não
existe
um
valor
absoluto
para
um
resultado analítico
Forma correta de expressar os resultados
Definição de exatidão e precisão
Importância de rejeitar resultados anômalos
Aula 3:
- Conceitos básicos (continuação)
- Noções de Quimiometria
RELAÇÃO ENTRE EXATIDÃO E PRECISÃO
A Exatidão e a Precisão se relacionam de 3 formas principais: Método de análise
C
B
A
preciso e exato !
preciso mas inexato
impreciso e inexato
Conc. do analito
Algumas formalidades... TERMINOLOGIAS
Codex Committee on Methods of Analysis and Sampling. Guidelines on Analytical Terminology (CAC/GL72 – 2009)
1)
Boa
precisão
= Boa
repetibilidade
≠
reprodutibilidade
TERMINOLOGIAS
1. Definição do problema analítico
2. Escolha do método de análise
3. Amostragem
4. Tratamento da amostra (e separação da espécie de interesse)
5. Calibração
6. Medida analítica RESULTADO (MÉDIA ± INCERTEZA)
7. Avaliação dos resultados : RESULTADO OBTIDO x RESULTADO ESPERADO 8. Ação
A ESTATÍSTICA NA ANÁLISE QUÍMICA
Comparação de Resultados:
6
Comparação
Precisões (Teste F)
Teste F (ou Teste de Snedecor)
F =
S
A2S
B2SE
F
calculado≥
F
tabeladopara a confiabilidade desejada
SE
F
calculado< F
críticopara a confiabilidade desejada
Não existe diferença significativa entre os conjuntos
de dados
Comparar
precisões
(ou variâncias)
de duas médias (A
e B)
Ex:
Valores críticos para F ao nível de 5%*
* A tabela indica as probabilidades dos valores serem diferentes
(confiabilidade de 95% para não haver diferença significativa entre os resultados)
3 4 5 6 12 20
Numer.
3
9,28 9,12 9,01 8,94 8,74 8,64
4
6,59 6,39 6,26 6,16 5,91 5,80
5
5,41 5,19 5,05 4,95 4,68 4,56
6
4,76 4,53 4,39 4,28 4,00 3,87
12
3,49 3,26 3,11 3,00 2,69 2,54
20
3,10 2,87 2,71 2,60 2,28 2,12
Denom.
Graus
lib.
8Tabelas para os valores críticos de F
EXERCÍCIO
Exerc
3-Comente sobre a diferença na precisão obtida nos laboratórios
A e B para a determinação de Mg em uma mesma amostra de
leite considerando um nível de confiança de 95%.
Dados:
Lab. A : 34,97; 34,85; 34,94 e 34,88 mg L
-1e
Após “entender” os conceitos de precisão e
exatidão, que erros afetam esses parâmetros ?
TIPOS ERROS:
- SISTEMÁTICOS (rastreados e evitados)
- ALEATÓRIOS (sempre presentes)
Erros de Método : surgem do comportamento
químico ou físico não ideal de sistemas analíticos
Erros Pessoais : resultam da falta de cuidado,
falta de atenção ou limitações pessoais do analista
Erros Instrumentais: causados pelo
comportamento não ideal de um instrumento, por calibrações falhas ou pelo uso de condições
1) Erros Sistemáticos ou Determinados
(Podem ser conhecidos e rastreados)
afetam a
exatidão
Como detectar um erro sistemático?
• Material certificado (CRM)
• Método de adição e recuperação
• Método comparativo
• Testes interlaboratoriais
Erros Sistemáticos ou Determinados
(
Podem ser conhecidos e rastreados
)
afetam a precisão
Variam de acordo com
uma
distribuição normal
Medidas flutuam
aleatoriamente
ao redor da média
2) Erros Indeterminados
(aleatórios ou randômicos)
Não podem ser localizados…
Ex de uma
Distribuição Normal
(Calibração de uma pipeta)
50 9.969 9.971 9.981 9.983 9.993 9.995 9.987 9989 9.975 9.977%
d
as
m
ed
id
as
30 10 Curva de Gauss (Perfil da distribuição)OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
volume (mL)
Histograma mostrando a
distribuição de 50 medidas do volume escoado por uma pipeta de 10 mL
Característica de uma Distribuição Normal
Os resultados são alterados ora para menos, ora para mais,
por erros que parecem se dar ao acaso (aleatórios), que é um comportamento esperado e, por isso, “normal”
Y =
1
σ √
2
π
exp - 1
2
(X
i-
µ
)
2σ
2Probabilidade de ocorrência de um resultado (Y)
Distribuição Normal de Gauss
µ corresponde a média da população
(situação de várias medidas)
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
Assim, pode-se calcular uma faixa para um resultado R supondo que os desvios observados seguem uma distribuição normal
Distribuição Normal e a Estatística Clássica
Para a estatística clássica os desvios da normalidade não afetam os resultados do ponto de vista estatístico (métodos robustos) e ista idéia é apresentada no “Teorema do Limite Central”:
“Se a flutuação total numa certa variável aleatória for o resultado da soma das flutuações de muitas variáveis independentes e de
importância mais ou menos igual, a sua distribuição tenderá para a normalidade, não importa qual seja a natureza das distribuições das
variáveis individuais”
0
0
0,1
0,2
0,3
0,4
+
_
+1
σ
+2
σ
-2
σ
-1
σ
µ
µ
= x
±
z
σ
√
N
F
re
quê
nc
ia
r
el
at
iva
Limites de confiança para a media de um resultado
Níveis de Confiança para Z % 50 0,67 68 1,00 80 1,28 90 1,64 95 1,96 95,4 2,00 99 2,58 99,7 3,00 99,9 3,29
Distribuição Normal de Gauss
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp) 18
µ
= x
±
t
S
√
N
Limites de confiança da média quando não se tem µ
µ
= x
±
z
σ
√
N
Graus de liberdade 95% 99% 1 12,71 63,66 2 4,30 9,93 3 3,18 5,84 4 2,78 4,60 5 2,57 4,03 6 2,45 3,71 7 2,36 3,50 8 2,31 3,36 9 2,26 3,25 10 2,23 3,17 . . .Exemplo 4
(aplicação do conceito na expressão de um resultado):
Um indivíduo fez
quatro
determinações de ferro em uma
liga metálica, encontrando um valor médio de 31,40% m/m
e uma estimativa do desvio padrão de
0,11% m/m. Qual o
intervalo em que deve estar a média da população
, com um
grau de confiança de 95%?
µ = ?
µ = 31,40 ± (
3,18
x
0,11
) / 4
µ = 31,40 ± 0,17
C
Fe= (31,23 – 31,57)% m/m
µ
= x
±
t
S
√
N
√
20Exemplo de aplicação deste conceito (Aula 4: Experimento de amostragem)
Ex: Comparação da
distribuição de cores
de confeitos M&Mcom a especificação do fabricante
Amostragem dos analistas diferentes
média (X) e estimativa do desvio (S) para cada cor Média do fabricante (µ)
Calcula-se
t
com a confiança desejada e compara-se com o valortabelado:
µ
- x
S
√
N
Outra aplicação para o Limite de confiança da média
Comparação de uma
média
com um
valor de referência
quando
não se tem o desvio do valor de referência e não
se pode calcular Sp
µ
= x
±
t
S
√
N
22 IC para o resultado “R” Valor referência Ex de situação em que o resultado obtido concorda com o valor de referênciaν
t tabelado= N-1
Principalmente
quando as precisões são comparáveis,
pode-se também comparar as médias:
Teste t, de
Student
Avaliar métodos diferentes
(n
1-1) S
12+ (n
2
-1) S
22n
1+ n
2- 2
S
p=
n é o número das medidas para cada média
Sp corresponde a S “agrupado”
x
1- x
2S
pt
=
n
1+ n
2n
1. n
2ν
t tabelado= n
1+n
2-2
Graus de liberdade 95% 99% 1 12,71 63,66 2 4,30 9,93 3 3,18 5,84 4 2,78 4,60 5 2,57 4,03 6 2,45 3,71 7 2,37 3,50 8 2,31 3,36 9 2,26 3,25 10 2,23 3,17 . . . . . . ∞ 1,96 2,58
Valores críticos para t nos níveis de 95 e 99%
(P= 0,025 e P= 0,005)
Testes estatísticos são válidos quando os erros envolvidos são aleatórios Mais confiáveis serão os testes quanto maior o ν (graus de liberdade)
Outras formas de utilizar o teste-t
Comparação de dados em pares (teste-t pareado)
d
S
d√
N
t
=
Amostras diferentes (do mesmo tipo ou de lotes diferentes) analisadas por métodos diferentes ou analistas diferentes
Procedimento:
1) Organizar os dados em pares
2) Calcular o “desvio padrão” entre as diferenças das médias (dos pares)
3) Calcular o valor de t:
EXERCÍCIO
Exerc
4-No seu trabalho de pós-graduação você fará comparação de resultados? Em caso afirmativo, qual teste será usado? Por quê?
Testes estatísticos para
comparação de resultados
-Precisão
-Exatidão
Testes de hipóteses
-Hipótese nula (H
0)
H
0: µ = µ
0Propagação de erros para um resultado R: alguns exemplos
(Erros em cada etapa do processo)
R = A + B – C
(soma e sub.)S
R=
√
S
A2+ S
B2+ S
C2R =
AB
C
S
RR
=
±
S
AA
2
S
BB
2
S
CC
2
Erros
indeterminados
+
+
(multiplicação e divisão) 28±
Propagação de Erros
Para “casa”
Exerc. 5:
Considerando que o S de uma balança seja de 0,0001 g,
calcule a estimativa do desvio-padrão de uma pesagem
feita nesta balança.
CASO DE
MÉTODOS INSTRUMENTAIS
DE ANÁLISE
O TRATAMENTO ESTATÍSTICO INCLUE TAMBÉM:
Regressão linear
Curva de calibração (ou analítica)
Tipos: -
univariada (“convencional”)
-
multivariada (métodos quimiométricos)
Estimativa dos Limites de detecção e quantificação
Cálculos baseados na Estimativa do desvio padrão do
branco para prever a detectabilidade do método
REGRESSÃO LINEAR
É a reta que melhor representa a relação entre a
propriedade medida (Abs, p. ex) e a concentração dos
padrões
Concentração (mg L
-1)
0 1A
b
so
rb
ân
ci
a
Padrões BrancoConcentração (mg L
-1)
0 1A
b
so
rb
ân
ci
a
Padrões Branco Abs= 48,3x + 0,24 r= 0,9987REGRESSÃO LINEAR
Uma Curva analítica linear nem sempre é possível e uma Regressão não-linear pode ser usada desde que apresente “boa correlação”
As Regressões lineares são as mais usuais e podem ser obtidas por meio de softwares, que usam o Método dos mínimos quadrados:
n= no de pontos (x
1;y1) da calibração
Para
y= ax + b
, com coef. correlação “
r
”:
a
= ______________
n Σx
iy
i– Σx
iΣy
in Σx
i2– (Σx
i)
2b
= y - x
r
= _______________________________
n Σx
iy
i– Σx
iΣy
i{ [nΣx
i2– (Σx
i2)] [nΣy
i2– (Σy
i)
2] }
1/2 32REGRESSÃO LINEAR
“Para casa”:
Vide ex. 4.9 e 4.10 do “Vogel – Análise Química Quantitativa”, 6ª Ed:
Para determinar quitina por fluorescência molecular utilizou-se padrões de quitina nas seguintes concentrações: 0,10; 0,20; 0,30 e 0,40 µg mL-1 e que resultaram nos seguintes valores de emissão,
respectivamente: 5,20; 9,90; 15,30 e 19,10, Cps sendo que o branco gerou leitura de 0,00 Cps. Considerando-se que um coeficiente de correlação linear superior a 0,99 é satisfatório, calcule a concentração de quitina de uma amostra cujo sinal analítico foi de 16,10 Cps.
REGRESSÃO LINEAR E
EFEITO MATRIZ
Sendo a Regressão linear uma reta “média” pode-se calcular a incerteza dos seus coeficientes angulares e lineares
As incertezas desses coeficientes podem ser usadas para avaliar a própria regressão bem como outros parâmetros
Avaliação do efeito matriz no desenvolvimento de um método analítico (comparação dos coef. angulares, a):
0 2 4 6 8 10 -0.002 0.000 0.002 0.004 0.006 0.008 0.010 0.012 0.014 0.016 0.018 0.020 A I Concentração de Pb (ug/L) Curva de adição de padrão
Curva analítica em meio ácido a
meio alcalino
a
meio ácido
1,60 10-3± 0,05 10 -3 1,78 10-3± 0,03 10-3
Comparação para um nível de 95% de confiança para saber se a calibração
poderia ser feita em meio ácido !
( y= ax + b )
REGRESSÃO LINEAR E EFEITO MATRIZ
Cálculo das incertezas de a e b :
S
y/x=
[
Σ(y
i–
y
^
)
2/ (n-2)
]
1/2Obtido usando a própria equação de regressão
S
a= ______________
S
y/x[
Σ(x
i– x )
2]
1/2S
b=
S
y/x[
Σx
i2
/ nΣ(x
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
Estimativa dos LIMITE DE DETECÇÃO (LOD) e
LIMITE DE QUANTIFICAÇÃO (LOQ)
Representam a DETECTABILIDADE DO MÉTODO
LEMBRAR: LOD instrumental é diferente do LOD método
Exemplo:
Para quantificar 0,02 mg.kg-1 Pb em uma amostra de peixe por GF AAS
o LOQ deve ser consideravelmente menor que 0,02 mg.kg-1 Pb
(Análise elementar = Amostra é digerida)
Na solução final a amostra fica diluída (10x p. ex) C Pb sol. amostra= 0,02 mg kg-1 / 10 = 0,002 mg kg-1
LOQ instrumental ≤ 0,002 mg.kg-1 Pb e não 0,02 mg kg-1
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
Estimativa dos LIMITE DE DETECÇÃO (LOD) e
LIMITE DE QUANTIFICAÇÃO (LOQ)
Definições
Limite de detecção:
É a menor concentração ou massa de analito que pode ser detectado com uma certa confiança
Depende da magnitude do sinal analítico em relação à flutuação do branco:
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
CÁLCULO do LIMITE DE DETECÇÃO (LOD)
CONSIDERAÇÃO:
LOD concentração correspondente ao Menor sinal detectável
Menor sinal detectável = Sinal branco + 3 S branco
Para que se tenha 99% de confiança
SE Curva analítica: (1) Y= m X + b b= Sinal branco
Na concentração limite Y = Menor sinal detectável (2)
X = LOD
Substituindo (2) em (1): Sinalbranco + 3 Sbranco = m LOD+ Sinalbranco
3 Sbranco = LOD
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
O LIMITE DE QUANTIFICAÇÃO (LOQ)
No nível do LOD a medida é significativamente afetada pelo
ruído instrumental (baixa precisão)
As medidas quantitativas devem ser feitas num nível superior ao LOD, geralmente:
10 S
brancoLOQ=
Outros Usos da Estatística no Laboratório
Métodos
quimiométricos
para
planejamento
e
otimização de experimentos, análise multivariada de dados e
calibração multivariada
“A quimiometria pode ser definida como sendo a aplicação de
métodos matemáticos e estatísticos no planejamento ou na
otimização de procedimentos e na obtenção de informações
químicas através da análise de resultados relevantes”
Recomendação
Literatura básica para estudos iniciais
Bruns, RE; Faigle, FG. “Quimiometria”,
Quím. Nova, 8 (1985) 84
Gemperline, PJ.
Practical Guide to Chemometrics (2nd Ed),
1
- Planejamento fatorial e otimização multivariada
- Conhecer como os diferentes parâmetros experimentais afetam o resultado do experimento (ou análise).
42
Tpyr Tat tpyr Mod
1
- Planejamento fatorial e otimização multivariada
- Estabelecer condições experimentais (instrumentais) otimizadas
Seleção das condições instrumentais do ICP OES
Sousa, RA; Silva, JCJ; Teófilo, RF; Cadore, S.; Baccan, N.
“Study of Instrumental Parameters for the Analysis of Milk by ICP OES Employing Factorial Design”,
Brazilian Meeting on Chemistry of Food and Beverages, 2004. Sousa, RA; Silva, JCJ; Teófilo, RF; Cadore, S.; Baccan, N.
“Study of Instrumental Parameters for the Analysis of Milk by ICP OES Employing Factorial Design”,
Brazilian Meeting on Chemistry of Food and Beverages, 2004.
-1,2 -0,72 2 4 6 8 10 12 14 16 M g I I / M g I
y= 6.74 + 1.89 P –
4.34 N – 0.59 A – 0.69
PN – 0.34 PA + 0.34 NA
2
- Análise multivariada de resultados
Um exemplo na área de Química analítica:ACP ACN Ca (mg L-1) 178 - 232 107 – 237 Mg 87 - 129 50 – 88 Mn 1,8 – 2,8 1,0 – 4,8 Fe 0,08 – 0,18 0,04 – 0,18 Zn 0,20 – 0,36 não detectado Cu 0,09 – 0,19 não detectado
Dados experimentais obtidos para as diferentes amostras:
2
- Análise multivariada de resultados
Considerando as variações para cada parâmetro (analito), busca-se as possíveis similaridades entre as amostras
UTILIZAR: Recursos para Análise exploratória, como PCA
Gráfico de scores: Amostras num espaço multidimensional
Na PCA realizada compara-se o Gráfico de scores com o de
loadings para se entender as “separações” encontradas
Verificação de correlações entre dados
3
- Calibração multivariada para análise de solos, alimentos,
medicamentos e fluidos biológicos
- Utiliza-se um único método analítico para detectar e
3
- Calibração multivariada para análise de solos, alimentos
e medicamentos
48
TABLE I:
Correlation Coefficient Values for Both Calibration and Validation Models Obtained via PLSR 1 for All Inorganic Elements
Element
Correlation Coefficient
Element
Correlation Coefficient
Calibration Validation Calibration Validation
Ca 0.99992 0.84705 K 0.99751 0.99558
P 0.98802 0.96488 Mg 0.96973 0.90379
3
- Calibração multivariada para análise de solos, alimentos
e medicamentos
TABLE II: Correlation Coefficient Values for Calibration and Validation Models Obtained via PLSR 1 for the Organic Compounds
Compounds
Correlation Coefficient
BIBLIOGRAFIA
1) D. A. Skoog, D. M. West, F. J. Holler, Stanley R. Crouch
Fundamentos de Química Analítica,
8a Ed., CENGAGE Learning, 2009
2) J. Mendham, R. C. Denney, J. D. Barnes, M. Thomas
Vogel - Análise Química Quantitativa,
6a ed., LTC, 2002
3) D. C. Harris,
Análise Química Quantitativa,
7a ed., LTC, 2008
4) B. B. Neto, I. E. Scarminio, R. E. Bruns,
Como Fazer Experimentos, Editora da Unicamp, 2001
5) J. N. Miller, J. C. Miller,
Statistics and Chemometrics for Analytical Chemistry, 5th Ed, Pearson Education Limited, 2005