1
Instituto de Química de São Carlos - IQSC Grupo de Química Medicinal do IQSC/USP
Carlos Montanari
Grupo de Química Medicinal & Biológica NEQUIMED/IQSC/USP
Departamento de Química e Física Molecular Instituto de Química de São Carlos
email: Carlos.Montanari@usp.br http://www.nequimed.iqsc.usp.br/
Carlos Montanari IQSC, 2022.1
Quimiometri a
Disciplina: 7500011 - Estatística e Quimiometria Prof. Dr. Sérgio Machado
Prof. Dr. Carlos Montanari
5
Quartas, 14 até 15h40 Sextas, 14 até 15h40
Sala)
Créditos Aula: 4 Créditos Trabalho: 2 Tipo: Semestral Objetivos
Introduzir: iii) À análise multivariada e planejamento fatorial de experimentos.
Docente(s) Responsável(eis) Sergio Antonio Spinola Machado Carlos Alberto Montanari
Tópicos abordados
1. Diversidade química e similaridade de dados 1. Emprego de métodos não-supervisionados de inteligência
artificial para obter informações latentes nos dados 1. Análise de componentes principais (PCA) para
transformação ortogonal de dados
1. Análise hierárquica de agrupamentos (HCA) para mineração e aglomeração de dados
1. Agrupamento hierárquico em componentes principais (HCPC) por combinação de PCA, HCA e partição de
grupos de dados
Bibliografia
1.Quimiometria.
Profa. Márcia Ferreira.
Editora da UNICAMP 2015 2. Química Medicinal.
Prof. Carlos Montanari.
Editora da USP – EDUSP 2011
6
Método de Ensino
• 1. Aulas expositivas
• 2. Apresentação de painéis (como este)
• Arquivos .pdf disponíveis no Moodle
7
Calendário
Início: 01 de Junho de 2022; Final: 23 de Julho de 2022
Azul = prova
Mês
Junho 01 03 08 10 15 29
Julho 01 06 08 13 15 20 22
8
ORGANIZAÇÃO
• Prova: Prova dia 22 de Julho
• Recuperação: Calendário da USP.
• Questões pontuais (No Moodle):
• Várias, durante o curso.
9 http://org.uib.no/ssc11/i
mages/faggrplogo.jpg
Por que estudar estatística e quimiometria?
doi: 10.30744/brjac.2179-3425.AR-38-2021
DOI: https://doi.org/10.26850/1678-4618eqj.v44.2.11-25
11 http://org.uib.no/ssc11/i
mages/faggrplogo.jpg
Por que estudar estatística e quimiometria?
Diferença entre métodos estatísticos e quimiométricos
Rocha, W.F.d.C.; Prado, C.B.d.; Blonder, N. Comparison of Chemometric Problems in Food Analysis using Non-Linear Methods. Molecules 2020, 25, 3025. https://doi.org/10.3390/molecules25133025
Rod Silva saved to Statistical Methods
Estatística descritiva: análise de dados para descrever, mostrar e resumir dados de maneira significativa.
É muito importante para apresentar dados brutos ineficazes/significativos
Este tipo de estatística é aplicado em dados já conhecidos.
https://www.geeksforgeeks.org/difference-between-descriptive-and-inferential-statistics/
Na estatística inferencial, as prediçõessão feitas tomando qualquer grupo de dados: uma amostra aleatória de dados retirados de uma população para
descrever e fazer inferências sobre a população.
Basicamente, permite que você faça predições tomando uma pequena amostra em vez de trabalhar com toda a população.
18
Definição
1. Quimiometria é a disciplina química que usa métodos matemáticos e estatísticos para:
→ Planejar ou selecionar condições ótimas de medidas e experimentos
→ Extrair o máximo de informação de dados químicos.
A quimiometria é a ciência de extrair informações de sistemas químicos
orientados por dados.
19
Quimiometria e Laboratórios Inteligentes
1.Ensaios (processos analíticos em tecnologia)
2.Qualidade do planejamento
1.Programas acadêmicos e industriais 3.Economia de custo e tempo
4.Modelagem quantitativa
1.Quão efetivo é o processo de validação 5.Otimização
Motivações para o planejamento
20
Quimiometria
1. Análise de dados:
1.1. Extração de informação dos dados químicos
2. Planejamento experimental:
2.1. Conteúdo de informação dos dados
3. Modelagem:
3.1. Investigação das relações complicadas
4. Obtenção de dados multivariados a partir de experimentos
Objetivos do Planejamento
• Maximizar a capacidade de testar hipóteses
• Facilitar a geração de novas hipóteses
Por quê é importante planejar?
Depois do Minitab
Por quê é importante planejar?
Depois do Minitab
Pergunta a responder:
Quantos fatores?
Mudança de estado da matéria
Ovos cozidos:
moles ou duros?
DOI: 10.1002/chemv.201200034
1. Ovo branco 2. Ovo “caipira”
3. Condições de armazenamento 4. Viscosidade da clara de ovo 5. Envenenamento por salmonela
(Salmonella enteritidis ouSalmonella typhimurium) 6. A arte de cozinhar um ovo:
Temperatura (reação endotérmica) 7. Tempo de aquecimento
Número de Fatores &
Planejamento Experimental
27 = 128 ensaios!
Efeitos de interações não significativos?
Efeitos principais não significativos?
Química na Cozinha.
Mudança de estado da matéria
DOI: 10.1002/chemv.201200034
Como reduzir
#fatores para apenas 2?
Resposta
Quimiometria
Química no Laboratório
1. Área de superfície dos reagentes 2. Concentração
3. pH
4. Temperatura 5. Catalisador
6. Solvente
7. Velocidade de agitação no reator
para avaliação do rendimento
pH = 3,4 [L] = 1,4 mM 16 + 16 experimentos?
Quantas replicatas?
pH = 4,4 [L] = 1 mM
Então, quimiometria.
Análise multivariada.
Para entender e reduzir as dimensões dos dados, analisando a estrutura de
covariância desses dados
Química no Laboratório
1. Área de superfície dos reagentes 2. Concentração
3. pH
4. Temperatura 5. Catalisador
6. Solvente
7. Velocidade de agitação no reator
37
dados
Banco de dados é um repositório de informações sobre um ou mais assuntos – um banco de dados.
É organizado de forma a facilitar a recuperação local ou remota de informações.
É capaz de processar muitas consultas contínuas durante um longo período de tempo.
38
Um banco de dados de produtos químicos é um banco de dados projetado especificamente para armazenar informações químicas.
Informação químicas (quiminformática) refere-se ao uso da teoria físico-química com técnicas de computação e ciência da
informação - as chamadas técnicas "in silico“. Além da química, inclui aplicações
para biologia e campos moleculares relacionados..
39 Shikano et al. 2020
Bancos de dados. Exemplos
Spectral Database for Organic Compounds,
SDBS
"ACToR"
41
Arranjo de dados
Poppi et al. QN 2005
42
Matriz X
nxp43
Escolha de 9 moléculas baseada em duas propriedades: y vs x
Brereton, 2003
44
Mas, e quando a escolha...
45
Análise fatorial em química
46
Análise de componentes principais (PCA): o método
X é a matriz de dados original;
C e S são matrizes que consistem nos perfis de cada composto;
E é uma matriz de erros.
E o Y?
O que você precisa saber sobre a Aula 1?
1. O que é quimiometria
2. Por que estudar estatística e quimiometria 3. Há diferença entre estatística e quimiometria
4. Por que é preciso planejar
5. Por que precisamos de análise multivariada 6. Por que precisamos selecionar variáveis 7. Qual a importância da análise fatorial em química
8. Por que precisamos de bancos de dados 9. Como arranjar uma matriz de dados 10. O que é análise não-supervisionada