• Nenhum resultado encontrado

4. Área de estudo

5.4 Analise fatorial Modo Q

Para a análise fatorial Modo Q foi utilizado uma rotina desenvolvida no software MATLAB, por De Luca (2009), na época aluna do Laboratório de Geoprocessamento e Sensoriamento Remoto, UNIVALI, SC, em parceria com o Laboratório Oceanografia Geológica da FURG, RS. A Figura 16 apresenta o fluxograma do programa em MATLAB para análise fatorial Modo Q (Anexo A).

0 5 10 15 20 25 30 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 % PHI

Santinho

33

FIGURA 16. PASSOS DO ALGORITMO REALIZADO NO SOFTWARE MATLAB DA ANÁLISE FATORIAL MODO Q (DE LUCA,2009).

5.4.1 Matriz Original

A matriz original é expressa como sendo uma matriz [X], com tamanho nxm onde n é o número de amostras de sedimento e m é o número de variável que é representado pela classe de sedimento, ver Tabela da matriz no Apêndice B. Cada linha desta matriz é um vetor objeto e as colunas são os valores em porcentagem das classes de tamanho de sedimento em phi.

A matriz original é composta por 669 amostras de sedimento e 33 variáveis, variando-se da classe -2,0 a 6 com intervalo de 0,25. Devido à grande quantidade de zeros e de valores muito baixos de porcentagem das classes nas caudas da distribuição das 33 classes de phi, o número de classes foi reduzido de 33 para 8 classes. Estes valores muito pequenos representam uma fração muito pequeno da variância entre as amostras, apresentando pouca informação sobre a relação entre as amostras.

34

Os primeiros 10 intervalos de classe foram agrupados em uma só classe (0,5 phi) e os valores acima de 4 foram também agrupados em uma só classe (4phi). E todas as outras classes entre estas duas classes foram distribuídos em intervalos de 0,5 phi. Esta matriz foi utilizada como dado de entrada no algoritmo de análise fatorial no referido programa em MATLAB.

5.4.2 Normalização dos Dados

Normalização (ou linha normalizada) dos dados, é realizada para que cada amostra seja representada por um vetor de unidade de comprimento, permitindo a comparação entre as classes. Os elementos da matriz [X] é dividido pela raiz quadrada da soma dos quadrados da linha.

...eq. 03 Onde:

W =Matriz de dados normalizados.

i = a ith linha da matriz.

k= número de variáveis de 1 a m.

5.4.3 Matriz de Similaridade

Após o processo de normalização é possível determinar a matriz de similaridade, pois o ângulo entre cada vetor representa a proporção da similaridade entre as amostras. A matriz formada pelos valores de similaridade é chamada a matriz cosseno teta, [H], que é encontrada pelo produto de maior momento no qual a matriz [W] é multiplicada pela sua transposta [W]’. A operação é descrita pela equação 04.

[H] = [W] [W]’ ...eq. 04

A matriz de cosseno theta de similaridade é nxm, sendo uma matriz simétrica onde os elementos mostram a similaridade. Nesta matriz todos os

35

elementos ao longo da diagonal serão 1,0 e fora os elementos serão valores entre 0,0 e 1,0 e indicam a proporcional similaridade entre os vetores objetos. A matriz de cosseno theta de similaridade dá a relação entre amostras.

5.4.4 Autovalor e Autovetores

O próximo passo é determinar o autovalor e autovetores através da matriz de cosseno theta de similaridade. Resolvendo os autovalores [V], e autovetores [L], a matriz formada.

[H] = [V] [L] [V]’ ...eq. 05

O autovalor é a proporção de similaridade nos dados que representam os autovetores. E os autovetores são vetores encontrado na dimensão m que representa a direção da similaridade nos dados.

5.4.5 Matriz de Carga Fatorial

A matriz de carga fatorial [Aq] é uma n x m, com as linhas como amostra de sedimento e as colunas as cargas dos fatores. A matriz [Aq] é formado quando cada membro da matriz de aoutovetores é multiplicado pela raiz quadrada do seu correspondente autovalor (valor singular). Representa a equação 06:

[AQ] = [V] [L] ...eq. 06

Para cada elemento da matriz de carga fatorial é denominado uma carga que se refere a amostra.

5.4.6 Matriz de Escora Fatorial

A matriz de escora fatorial [Fq] representa as estimativas da contribuição dos fatores a cada variável original. Ela é obtida pela multiplicação da transposta da matriz normalizada [W]’ pela matriz de cargas fatoriais [Aq]:

[Fq] = [W]’ [Aq] ...eq. 07

A matriz de escora fatorial [Fq] é uma m x m tendo como linha os fatores e as variáveis as colunas. Representa a contribuição de cada fator nas variáveis originais. O [Fq] é obtida pela multiplicação da transposta da matriz normalizada [W]’ pela matriz de cargas fatoriais. Equação 07:

36

5.4.7 Encontrar o Número de Fatores.

Determina o número de fatores necessários para recriar os dados originais. O método aplicado neste trabalho para encontrar o número de fatores adequado é através da quantidade de explicação que os autovalores contribuíram para a solução, soma dos valores acumulado (cumunalidade) e calcular a percentagem de variância explicada por um, dois ou três fatores, em seguida, escolher quantos fatores são necessários para dar uma representação o som dos dados originais.

5.4.8 Rotação Ortogonal

Uma vez que o número de fatores foi determinado, a rotação dos elementos do espaço é normalmente necessária para facilitar a interpretação, diminuindo a variação dos dados quando o eixo, cada fator deve envolver todos ou maioria dos objetos. Os objetos devem ter moderados ou elevados valores de cargas para fatores fortes, as cargas devem variar entre 1 e -1. Quando o objeto apresentar uma carca de 1 ou -1 isto indica uma perfeita representação do fator e quando apresenta carga 0 não apresenta nenhuma representação.

O método utilizado foi a rotação varimax, é um processo em que dois eixos do fator são rodados de cada vez. Esta rotação não afeta a relação entre as amostras e preserva a ortogonalidade dos fatores.

5.4.9 Rotação Oblíqua

Na solução oblíqua os fatores são rotados individualmente para que haja uma adequação dos fatores em cada grupo distinto. Apesar dos fatores na solução obliqua não serem mais ortogonais, eles coincidem com os reais objetos. Isto é uma vantagem em algumas situações onde o conjunto de dados pode ser processado e desnormalizado, e as cargas fatoriais são expressas através de porcentagens verdadeiras em vez de valores de cosseno-theta ou projeções de cada objeto no eixo fatorial. O método de Imbrie descrito por JORESKOG et al. (1976) para determinar as chamadas amostras referência dos dados oblíquos é geralmente usada na ordem de procurar os mais diversos objetos em um conjunto de dados.

37

5.4.10 Ranque das Cargas Fatoriais

Para efeito de comparação a carga fatorial foi ranqueada em relação a Explicação do Fator como apresentado na Tabela 3 que mostra os valores das cargas e sua explicação, sendo uma amostra com carga fatorial 0,9-1 apresenta uma explicação muito alta por um fator.

Tabela 3 Carga Fatorial e Explicação

Carga Fatorial Explicação do fator 0,0-0,19 Bem Baixa

0,2-0,39 Baixa 0,4-0,69 Moderada 0,7-0,89 Alta 0,9-1,00 Muito Alta

A Figura 17, apresenta a composição granulométrica aproximada da amostra de cada um dos fatores referentes a respectiva carga fatorial descrita na Tabela 3.

A tabela das cargas fatoriais das amostras está no Apêndice F

Documentos relacionados