• Nenhum resultado encontrado

2. REVISÃO BIBLIOGRÁFICA

2.3. Metabolômica e GC×GC – Abordagem Estatística Multivariada

Os estudos envolvendo análises de metabólitos, assim como quaisquer outras análises necessitam, muitas vezes, de uma análise estatística dos dados. Atualmente as técnicas analíticas tem se tornado cada vez mais complexas, gerando assim um volume de dados cada vez maior e nesse cenário, técnicas quimiométricas ganham destaque por sua capacidade de tratar essas grandes quantidades de dados de forma eficaz.

A quimiometria, que teve origem em análise multivariada de dados de psicologia (psicometria) e ecomomia (econometria), tem o objetivo de extrair informações concretas de dados de origem química por meio do uso da matemática e da estatística, bem como planejar/otimizar experimentos.54,55

Na cromatografia, os desvios mais comumente encontrados são coeluições, deslocamento de tempo de retenção, drift da linha de base e baixa relação sinal/ruído, os quais podem ocorrer de uma só vez. Muitas vezes, devido a ruídos (inerentes ou não da técnica) e interferências a interpretação dos dados se torna uma tarefa difícil, podendo mascarar o resultado.56 Assim, antes mesmo de se utilizar de métodos quimiométricos avançados, o uso de pré- processamentos dos dados se faz necessário. Os pré-processamentos utilizados para cromatografia são a correção de linha base, suavização do ruído e, principalmente, o alinhamento dos tempos de retenção.

Os deslocamentos de tempo (time shift) de retenção em GC pode ocorrer devido a parâmetros conhecido e controláveis, como a mudança de comprimento da coluna de separação, vazamentos no sistema de injeção e devido às injeções realizadas de forma manual, e na GC×GC a extensão desses deslocamentos ocorridos depende desses parâmetros cromatográficos bem como da repetibilidade intrínseca do sistema, que é um fator aleatório.46,51

Desde o primeiro trabalho publicado em 1998, o método para a correção desses deslocamentos de tempo de retenção (também chamado de alinhamento) mais utilizado é o método Correlation Optimised Warping (COW). Alinhamento para dados cromatográficos é definido como uma operação matemática que reposiciona características químicas similares a fim de fazer com

que apareçam em tempos de retenção iguais em diferentes corridas cromatográficas.56,57

O método COW alinha os cromatogramas sincronizando os sinais e usa um cromatograma de referência para comprimir e expandir os segmentos de cada amostra no conjunto de dados, mas deve manter a informação de área intacta. A flexibilidade desses ajustes pode ser alterada de acordo com a necessidade sendo que uma maior flexibilidade implica em um maior ajuste bem como maior o risco de introduzir artefatos nos dados, da mesma forma que pequenos deslocamentos (uma menor flexibilidade) evita a introdução de um grande número de artefatos, porém diminui o ajuste.31,56

Dados de GC×GC são bastante volumosos e complexos se comparados com dados obtidos por GC e quando utilizados em investigações de cunho biológico, como o estudo de um grupo específico de matabólitos de determinado organismo, é necessário que se utilize tratamentos de dados que permitam evidenciar até mesmo as variações e diferenças mais sutis entre os perfis.31

Dados de GC×GC possuem informações de tempo de retenção (tR) na

¹D e ²D (¹tR e ²tR, respectivamente) se tornando uma estrutura em duas

dimensões. Quando essa técnica é acoplada a um espectrômetro de massas como detector, por exemplo, cada ponto do plano cromatográfico, o qual possui informações únicas de ¹tR e ²tR, o espectro de massas para aquele ponto do

cromatograma contribui para um arranjo tridimensional do arranjo de dados. Assim, para um grupo de amostras com tríades de dados, tem-se um arranjo em quatro dimensões (dados de ordem superior), tornando a interpretação uma tarefa mais difícil, e é por esse motivo que a quimiometria é tão importante em estudos envolvendo GC×GC.25

Em uma análise univariada de um sistema o objetivo é identificar se uma amostra é estatisticamente diferente de outra amostra por meio de um teste

t, por exemplo. Entretanto, em uma abordagem dentro do escopo da

metabolômica, vários metabólitos podem não apresentar significância estatística individualmente, gerando falsos resultados. Dessa forma, uma abordagem multivariada, ou seja, avaliando vários (ou todos) os compostos químicos de

forma simultânea, é possível alcançar resultados mais significativos e representativos do sistema.15

Diversos são os métodos quimiométricos multivariados sendo suas aplicações as mais variadas. De maneira geral, na química analítica são aplicados métodos de regressão multivariada, métodos de decomposição de dados, reconhecimento de padrões dentre outros.25,58

Em dados de metabolômica, as análises de reconhecimento de padrões podem ser uma alternativa útil para entender o funcionamento de um sistema biológico em função do tempo, por exemplo, ou ainda mediante a perturbações externas. Como a quantidade e diversidade de metabólitos presentes nas amostras são variáveis, as análises de reconhecimento de padrões podem auxiliar no melhor entendimento de quais são os compostos responsáveis por diferenciar os agrupamentos de amostras.31 Para uma visão mais ampla do sistema, geralmente desconhecido, análises multivariadas utilizando métodos não supervisionados de reconhecimento de padrões são realizadas, como a Análise de Componentes Principais (Principal Component Analysis – PCA) e análise discriminante por mínimos quadrados parciais (Partial Least Squares

Discriminant Analysis – PLS-DA), sendo estes os métodos de reconhecimento de

padrões mais representativos.25

O PCA é um método baseado na decomposição da matriz de covariância das variáveis originais, e assim transforma os dados de forma a reduzir sua dimensionalidade (variáveis), representando-os em um espaço mais simples, com menos dimensões. Essas novas variáveis devem conter a maior variância possível do sistema inicial e são formadas a partir da combinação linear das variáveis originais correlacionadas, conhecidas assim como componentes principais (Principal Components – PCs).15,58

A matriz de dados X (I×J) pode ser decomposta nas matrizes de escores (T), pesos (P) e resíduos (E) onde J é o número de colunas as quais são relaciona das com o número de variáveis e I é o número de linhas as quais se relacionam ao número de amostras, nas quais h é o número de componentes principais.

Matriz de Escores (T): possui dimensionalidade (I×h) e expressa a relação entre as amostras;

Matriz de Pesos (P): possui dimensionalidade (J×h) e expressa a relação entre as variáveis do sistema:

Matriz de Resíduos (E): possui dimensionalidade (I×J) assim como a matriz X, e contém resíduos aleatórios, dados não explicados pelo PCA.

Em dados de metabolômica, os gráficos de escores explicitam a relação e o agrupamento natural das amostras avaliadas, e os gráficos de pesos indicam a relação entre as variáveis, que nesse caso correspondem os tempos de retenção dos picos dos metabólitos encontrados; a combinação das informações desses gráficos mostra quais metabólitos estão envolvidos na similaridade dessas amostras em estudo.

A primeira PC (PC1), assim como as demais PCs, é a combinação linear de todas as variáveis e contém a maior quantidade de variância explicada dos dados originais dentre todas as PCs. A segunda PC (PC2) é ortogonal à PC1 e, da mesma forma que esta, é uma combinação das variáveis originais e explica a maior quantidade de variância dos dados restantes (figura 6). As PCs restantes seguem a mesma lógica que as primeiras.58

Figura 6: Representação matemática da decomposição dos dados da matriz X em componentes principais. Adaptado de Kumar 2014.58

Em dados de GC×GC, a PCA pode ser utilizada para encontrar agrupamentos de amostras por suas correlações utilizando tabela de integração de picos cromatográficos, uma vez que o algoritmo utilizado para tal análise é incompatível com dados de duas ou mais dimensões.25,60,61

Nesse sentido, para dados de ordem superior como os de GC×GC, a Análise de Componentes Principais Multimodo (MPCA - Multiway Principal

No MPCA os dados, originalmente tridimensionais, serão desdobrados em matrizes, para que o mesmo tratamento matemático de PCA possa ser aplicado25,54,62

3. OBJETIVOS

Documentos relacionados