• Nenhum resultado encontrado

4.3 O Conceito de F´ acies S´ısmicas e os M´ etodos Estat´ısticos Multivariados

4.3.3 A An´ alise de componentes Principais (PCA)

A an´alise de componentes principais (PCA), tˆem sido desde o in´ıcio considerada como o mais valioso resultado aplicado da ´algebra linear. Originalmente, esse m´etodo foi desenvolvido por HOTELLING (1933), que realizou um estudo com 140 alunos de uma escola, estudando quatro caracter´ısticas por aluno, sendo elas: a velocidade da leitura, o poder da leitura, a velocidade em realizar opera¸c˜oes aritm´eticas e o poder de realizar opera¸c˜oes aritm´eticas. Usando esse exemplo, todo o procedimento de PCA que ser´a aqui detalhado, foi desenvolvido. Desde ent˜ao, a an´alise de PCA (como ser´a chamada a partir de agora), tem sido aplicada nos mais vastos campos da ciˆencia, desde a neurociˆencia, passando pelas ciˆencias sociais e pela computa¸c˜ao gr´afica, at´e a caracteriza¸c˜ao de reservat´orios. Sua popularidade se deve especialmente ao fato de ser um m´etodo relativamente simples, e n˜ao param´etrico de se extrair informa¸c˜oes relevantes de um conjunto de dados complexos. Com um baixo custo computacional, a an´alise de PCA, fornece uma maneira eficiente de se reduzir dados complexos em um conjunto menor e que muitas vezes revela estruturas simplificadas e escondidas na grande massa de dados. Como j´a foi dito, tenta-se em qualquer ´area da ciˆencia entender um determinado fenˆomeno por meio de medidas de v´arias quantidades. Infelizmente, ao se medir muitas vari´aveis, os dados `as vezes podem parecer redundantes e suas correla¸c˜oes n˜ao ficam claras. Isso n˜ao ´e um problema trivial, mas um obst´aculo fundamental para qualquer ciˆencia emp´ırica. Os exemplos s˜ao muitos, que tratam com sistemas complexos de dados, como a neurociˆencia, a fotometria, a meteorologia, a oceanografia, a geof´ısica, e aqui especificamente, a s´ısmica voltada para a caracteriza¸c˜ao de reservat´orios. Em todas essas ´areas o n´umero de vari´aveis medidas ´e grande, e ao mesmo tempo podem ser decepcionantes, uma vez que informa¸c˜oes relevantes se escondem subjacentes aos dados.

Esse m´etodo permite a redu¸c˜ao da dimensionalidade dos pontos representativos das amostras, pois, embora a informa¸c˜ao estat´ıstica presente nas n-vari´aveis originais seja a mesma dos componentes principais, ´e comum obter em apenas 3 componentes mais de 90% desta informa¸c˜ao, dependendo do dado que se encontra sob an´alise. Assim, como ser´a visto, o gr´afico da componente 1 versus a componente 2, fornece uma janela privilegiada estatisticamente para as observa¸c˜oes dos pontos no espa¸co n-dimensional.

A an´alise de componentes principais tamb´em pode ser usada para julgar a importˆancia das pr´oprias vari´aveis originais escolhidas, ou seja, as vari´aveis originais com maior peso na combina¸c˜ao linear dos primeiros componentes principais s˜ao as mais importantes do ponto de vista estat´ıstico. Desse modo, ´e poss´ıvel por meio da an´alise de PCA, revelar estruturas subjacentes aos dados.

Na realidade, o que se deseja com a an´alise de componentes principais ´e responder a seguinte pergunta: existe uma outra base, ou sistema, onde a combina¸c˜ao linear dos dados originais, melhor expressa o que se procura? Pelo fato de se buscar por combina¸c˜oes lineares, a ´algebra linear se presta de modo eficiente para buscar uma solu¸c˜ao para a an´alise de PCA. A solu¸c˜ao ´e baseada em uma importante propriedade da decomposi¸c˜ao de autovalores. Para isso considere que os dados est˜ao organizados numa matriz X, nxm, onde n ´e o n´umero do tipo de medidas (atributos) e m, ´e o n´umero de amostras, (tra¸cos). O objetivo ent˜ao ´e encontrar uma matriz ortonormal P, onde Y=P.X, de modo que a matriz de covariˆancia:

Cy = (1/m − 1).Y.YT, (4.1)

seja diagonalizada. Desse modo as linhas da matriz P s˜ao as componentes principais da matriz X.

seguinte maneira: Cy = m−11 (P X)(P X)T = m−11 P XXTPT = m−11 P (XXT)PT Cy = m−11 P APT. (4.2)

Pode-se observar que uma nova matriz A foi definida. Onde A = XXT, e a matriz A por

defini¸c˜ao ´e dita sim´etrica.

O objetivo aqui ´e reconhecer que uma matriz sim´etrica A ´e diagonalizada pela matriz ortogonal dos autovetores, de acordo com um teorema da ´algebra linear. Assim, para a matriz sim´etrica A, temos que:

A = EDET. (4.3)

Onde D ´e a matriz diagonal e E ´e a matriz dos autovetores.

A matriz A, tem r ≤ n autovetores ortonormais, onde r, ´e o rank da matriz. O rank da matriz A ´e menor que n, quando A ´e dito degenerado, ou seja, todos os dados ocupam um subespa¸co de dimens˜oes r ≤ n. Mantendo-se a restri¸c˜ao de ortogonalidade, pode-se remediar essa situa¸c˜ao selecionando n − r vetores ortogonais, de modo a preencher a matriz E. Esses vetores adicionais n˜ao afetam a solu¸c˜ao final, pois as variˆancias associadas a essas dire¸c˜oes s˜ao iguais a zero.

Assim, seleciona-se a matriz P, para ser a matriz onde cada linha pi ´e um autovetor de

XXT. Por essa sele¸c˜ao, P ≡ ET. Substituindo essa rela¸c˜ao na Equa¸c˜ao 4.2, encontra-se que

A = PTDP . Com essa rela¸c˜ao e com o teorema da ´algebra linear que diz que a inversa de

Cy, da seguinte maneira: Cy = m−11 P APT = m−11 P (PTDP )PT = m−11 (P PT)D(P PT) = m−11 (P P−1)D(P P−1) Cy = m−11 D. (4.4)

Fica evidente que a escolha de P, diagonaliza a matriz de covariˆancia Cy. Essa dedu¸c˜ao ´e

muito importante para o desenvolvimento da an´alise de PCA. Desse modo ´e poss´ıvel resumir os resultados da PCA nas matrizes P e Cy:

• As componentes principais da matriz X, s˜ao os autovetores de XXT, ou as linhas da matriz P;

• O i-´esimo valor na diagonal da matriz Cy ´e a variˆancia da matriz X ao longo de pi.

A partir dessa solu¸c˜ao alg´ebrica, ´e necess´ario desenvolver uma maneira computacional de se realizar a an´alise de PCA. A maneira mais amplamente utilizada na literatura e que foi usada nesta tese ´e calcular as componentes por meio da decomposi¸c˜ao de valores singulares.

Para isso, considere X, como sendo uma matriz arbitr´aria nxm e que XXT, seja uma matriz de rank r, quadrada e sim´etrica. Para se realizar a decomposi¸c˜ao, determinadas grandezas precisam ser conhecidas, a saber:

• v1, v2, v3, ..., vn ´e um conjunto de autovetores ortonormais mx1, com os autovalores

associados λ1, λ2, λ3, ..., λn, para a matriz sim´etrica XTX, de modo que (XTX)vi = λivi;

• σi ≡

λi, ´e um positivo real e definido como valores singulares;

• u1, u2, u3, ..., un ´e um conjunto de vetores ortonormais nx1 definidos por: ui =

(1/σi)Xvi.

Com essas grandezas definidas, e de posse de um teorema da ´algebra linear, que diz que para uma matriz qualquer X de dimens˜oes nxm, a matriz sim´etrica XTX, tem um

u1, u2, u3, ..., un. O conjunto de vetores Xv1, Xv2, Xv3, ..., Xvnforma uma base ortogonal onde

cada vetor Xvi tem comprimento

√ λi.

Com isso, se tem o necess´ario para realizar a decomposi¸c˜ao. O que ´e dito como o valor na decomposi¸c˜ao de valores singulares, nada mais ´e que uma forma de reescrever a terceira defini¸c˜ao.:

Xvi = σi.ui. (4.5)

O resultado nos diz que X multiplicado por um autovetor de XTX ´e igual a um escalar vezes um outro vetor. Assim, o conjunto de autovetores v1, v2, v3, ..., vn e o conjunto de vetores

u1, u2, u3, ..., un s˜ao ambos conjuntos ortonormais, ou a base num espa¸co de dimens˜ao r.

´

E poss´ıvel resumir esse resultado para todos os vetores em uma matriz de multiplica¸c˜ao de acordo com a constru¸c˜ao a seguir, de modo a gerar uma nova matriz diagonal Σ:

Σ ≡

σi 0 0

0 σr 0

0 0 0 .

(4.6)

Onde σ1 ≥ σ2 ≥ σ3 ≥, ..., σr, s˜ao os conjuntos de valores singulares, ordenados pelo seu rank.

Do mesmo modo ´e poss´ıvel construir matrizes ortogonais V e U, onde: V = v1v2, ..., vn.

U = u1u2, ..., un.

(4.7) Onde, do mesmo modo como foi mencionado anteriormente, vetores ortonormais (m − r) e (n − r) s˜ao inseridos de modo a preencher as matrizes V e U respectivamente. A Equa¸c˜ao 4.6 fornece uma representa¸c˜ao gr´afica de como todas as partes se ajustam para formar ent˜ao

ent˜ao a forma final da decomposi¸c˜ao:

X = U ΣVT. (4.9)

Embora aparentemente simples, tal decomposi¸c˜ao ´e muito poderosa. A Equa¸c˜ao 4.9, mostra que qualquer matriz arbitr´aria X, pode ser convertida para uma matriz ortogonal, uma matriz diagonal e outra matriz ortogonal. Isso representa realizar rota¸c˜oes com a base de dados, e essas rota¸c˜oes projetam os dados em uma outra base de coordenadas o que ´e a base da PCA, que por sua vez, pode ser vista ent˜ao, como uma rota¸c˜ao dos dados multidimensionais de modo que a variabilidade m´axima seja projetada em cada par de combina¸c˜ao dos eixos. No caso da an´alise de PCA utilizando a SVD, as colunas da matriz V, s˜ao as componentes principais da matriz X.

Calcular a PCA, usando a SVD, na pr´atica, pode ser resumido nas seguintes etapas:

1. Os dados precisam ser padronizados por algum m´etodo de pr´e-processamento, como por exemplo a normaliza¸c˜ao, ou o autoescalamento, isso faz com que se possa trabalhar com vari´aveis que medem grandezas diferentes como os atributos s´ısmicos;

2. Os dados precisam ser organizados numa matriz nxm, onde n ´e o n´umero de atributos estudados e m ´e o n´umero de amostras;

3. Por fim, ´e realizada a SVD, ou o c´alculo dos autovetores da matriz de covariˆancia, que deve ent˜ao ser obtida.

Um benef´ıcio importante dessa metodologia, como j´a foi mencionado, ´e que ´e poss´ıvel analisar as variˆancias Cy associadas com as componentes principais. Normalmente encontra-se que

grandes variˆancias est˜ao associadas com os primeiros k ≤ n componentes principais, e a partir de uma determinada componente ela come¸ca a decair. Com isso ´e poss´ıvel concluir que, as fei¸c˜oes mais importantes do dado est˜ao nas primeiras k componentes. Esse processo recebe o nome de redu¸c˜ao da dimensionalidade.

Como j´a foi dito de forma exaustiva, a an´alise de PCA tem grandes aplica¸c˜oes dentro do processo de caracteriza¸c˜ao de reservat´orios, o que pode ser constatado com as referˆencias j´a citadas. Embora seja aplicada vastamente, a an´alise de PCA ainda possui determinadas

limita¸c˜oes que em certos casos levam a resultados n˜ao muito eficientes. Existem, por´em, outros m´etodos que tratam de problemas multivariado e que basicamente podem ser aplicados para se comparar os resultados com a PCA, um desses m´etodos ainda novo no contexto de caracteriza¸c˜ao de reservat´orios ´e conhecido como an´alise de componentes independentes, ou ICA.