• Nenhum resultado encontrado

3. FUNDAMENTAÇÃO TEÓRICA

3.6 QUIMIOMETRIA

3.6.5 Resolução multivariada de curvas

3.6.5.1 Resolução Multivariada de Curvas por Mínimos Quadrados Alternantes

Para a resolução do MCR, emprega-se um processo interativo utilizando o algoritmo de mínimos quadrados alternantes (ALS, do inglês Alternating Least-

50

Squares). O método MCR-ALS busca encontrar de forma interativa os perfis de

concentrações individuais das espécies que melhor explicam a variância dos dados observados, com o mínimo de erro possível. Esta recuperação é baseada na ideia de que a matriz de dados é bilinear, ou seja, que ela pode ser decomposta no produto de duas matrizes.99,126,128

Para que o método MCR-ALS possa ser aplicado, os dados devem possuir uma relação linear com a concentração. Outra condição que deve ser atendida é a análise de posto (do inglês, rank) da matriz. O posto da matriz de dados do analito puro e das misturas devem ser calculados e comparados, assim como da matriz de dados com todas as amostras. O posto da matriz total de espectros deve ser igual ao número de espécies analisadas nas misturas. Este é o número correspondente ao número de linhas e colunas linearmente independentes, ou seja, o número de vetores que não podem ser escritos como uma combinação linear dos outros.98,129– 131

O número de componentes presentes na matriz podem ser determinados com a estimativa do posto, que é realizada por meio da porcentagem de variância explicada por decomposição em valores singulares (SVD, do inglês Singular Values

Decomposition)128,132 ou PCA128,133. Também é possível ter conhecimento prévio dos componentes presentes na amostra e caso exista esta alternativa, o número de componentes podem ser definidos de acordo com a composição.

O algoritmo ALS calcula as concentrações das matrizes puras C e ST a partir das estimativas iniciais que devem ser fornecidas ao modelo. Quando esta informação não está disponível, pode ser aplicado o método de seleção de variáveis puras, utilizando os métodos de Análise de Fatores Evolucionários (EFA, do inglês

Evolving Factor Analysis)134,135 e métodos baseados na aproximação da variável pura (do inglês, pure)128,136,137. As estimativas iniciais obtidas pelo pure selecionam as colunas com as variáveis mais puras de acordo com o número de fatores que podem existir na amostra, e este método tem como base o método SIMPLISMA (do inglês, SIMPLe-to-use InteractiveS Mixture Analysis),138,139. Este método assume que cada componente de uma mistura tem uma variável com intensidade finita para dado componente e intensidade zero para os demais. O SIMPLISMA utiliza a variância e critérios de similaridade para encontrar as variáveis puras, e faz uma relação máxima entre o desvio padrão e a média.137–139

3. Fundamentação Teórica

51

O algoritmo ALS inicia a otimização do modelo a partir das Equações 14 ou 15, que dependem das estimativas iniciais obtidas para a concentração (Cinit) e dos perfis espectrais (STinit) obtidos a partir da escolha do número de componentes.98,99,128,130,140

Equação (14)

Equação (15)

O sinal "+" indica a operação de pseudoinversa. O procedimento de otimização repete os dois passos descritos nas Equações 14 e 15, nos quais as estimativas iniciais são substituídas pelos valores estimados na interação anterior do ALS, até que o critério de convergência de minimização da matriz de resíduos (E) seja alcançado ou até o algoritmo atingir o número máximo de interações. 98,99,128,130,140

A solução fornecida pelo modelo MCR-ALS deve ser avaliada com critério, a partir da comparação com os espectros puros iniciais e os espectros recuperados, pois tal modelo fornece diferentes soluções a partir de diferentes combinações entre as matrizes C e S, e estas podem não fornecer o resultado esperado referente ao sentido químico. Para dados espectrais, por exemplo, bandas de absorção podem ser omitidas ou estarem presentes em determinadas regiões de uma varredura espectral que não deveriam apresentar tal sinal. Esta situação caracteriza uma falha de convergência do modelo, denominada como ambiguidade rotacional, sendo estas características uma desvantagem do MCR-ALS.99,128,130,141

Todavia, para minimização dos efeitos de ambiguidade rotacional, podem ser impostas ao MCR restrições matemáticas que tendem a diminuir o número de interações e corrigir os erros existentes. As principais restrições utilizadas são ilustradas nas Figuras 15 (a), (b) e (c), respectivamente, e descritas a seguir.99,126,128,130,141

i) não negatividade da concentração e dos espectros: esta restrição impõe que os valores de concentração (C) e o sinal analítico (S) (espectros, cromatogramas, etc.) tenham apenas valores positivos,

ii) balanço de massa (do inglês, closure): requer que o somatório das concentrações relativas de uma amostra durante o processo de otimização do

52

modelo seja constante, ou seja, a soma de todas as concentrações prevista será igual a, por exemplo, 100 %.

iii) unimodalidade: esta restrição é aplicada para que o sinal analítico (cromatograma, sinal voltamétrico, perfis espectrais) apresente um único ponto máximo por perfil.

Figura 15. Restrições utilizadas no MCR-ALS (a) não negatividade, (b) balanço de massa e (c) unimodalidade.126

A Figura 16 ilustra o MCR-ALS aplicado à decomposição de uma matriz de dados usando MCR-ALS em espectroscopia de imagem. A matriz S corresponde aos espectros puros obtidos, a matriz de concentração (C) é então desdobrada para recuperar as informações contidas nos pixels. Por fim, são construídos mapas de distribuição de cada componente a partir da matriz de concentração das estimativas inicias fornecidas ao modelo.

3. Fundamentação Teórica

53

Figura 16. Representação esquemática da aplicação do MCR-ALS aos dados de espectroscopia de imagem.

O MCR pode ser aplicado tanto na análise de mais de uma matriz de dados simultaneamente, quanto de uma única matriz. Quando o MCR é aplicado na decomposição de mais de uma matriz, estas são organizadas de forma adjunta, uma abaixo da outra (no sentido das colunas) ou uma ao lado da outra (no sentido das linhas) dependendo das estimativas iniciais serem os perfis espectrais ou de concentração. Tal procedimento gera uma matriz aumentada, que pode ser aplicado para aquisição de dados em espectroscopia de imagem. 21,126

54

CAPÍTULO 4

Análise exploratória da distribuição de holocelulose e lignina total

em diferentes espécies de madeira por imagem hiperespectral e

espectroscopia Raman

4. Análise exploratória da distribuição de holocelulose e lignina total em diferentes espécies