• Nenhum resultado encontrado

3.3 Invers˜ ao FWI

3.3.3 Invers˜ ao FWI como um problema de otimiza¸c˜ ao

No que diz respeito ao esquema de otimiza¸c˜ao empregado na invers˜ao FWI, temos dois tipos: os m´etodos de otimiza¸c˜ao global e os m´etodos de otimiza¸c˜ao local. A otimiza¸c˜ao global, tamb´em conhecida como abordagem estoc´astica, permite encontrar o m´ınimo global realizando buscas em todo o espa¸co do modelo evitando,

assim, a convergˆencia para m´ınimos locais. Todavia, a busca em todo o espa¸co do modelo torna-se impratic´avel para a maioria dos problemas geof´ısicos de grande porte, sobretudo em aquisi¸c˜oes 3D, diante da grande dimens˜ao do modelo e da capacidade computacional requerida para o processamento dos dados adquiridos (PLESSIX et al., 2013).

Diante disso, utilizam-se m´etodos de otimiza¸c˜ao local, ou abordagens determin´ısticas, baseados no gradiente do funcional objetivo. O grande problema da abordagem local ´e a possibilidade de convergˆencia para uma solu¸c˜ao local, o que requer um modelo inicial suficientemente pr´oximo ao modelo real, onde encontra-se o m´ınimo global do funcional objetivo. O modelo inicial geralmente ´e obtido mediante emprego de t´ecnicas de an´alise de velocidade de menor complexidade.

a) M´etodo de Newton

Seja o modelo m na vizinhan¸ca do modelo inicial m0, para o qual:

E(m) ≤ E(m0), (3.17)

para minimiza¸c˜ao do funcional objetivo, podemos expandir a fun¸c˜ao descrita acima em uma s´erie de Taylor em torno do modelo inicial m0 e tom´a-la por uma fun¸c˜ao

quadr´atica, desprezando os termos acima de 2a ordem:

E(m) ≈ E(m0) + N X j=1 ∂E(m0) ∂mj ∆mj+ 1 2 N X j=1 N X k=1 ∂2E(m0) ∂mj∂mk ∆mj∆mk. (3.18)

Assumindo a aproxima¸c˜ao do funcional objetivo continuamente diferenci´avel e derivando parcialmente em rela¸c˜ao ao parˆametro ml do modelo, o m´ınimo local da

fun¸c˜ao quadr´atica, em torno de m0, encontra-se no ponto em que a primeira derivada

parcial da fun¸c˜ao ´e igual a zero: ∂E(m) ∂ml = ∂E(m0) ∂ml + N X j=1 ∂2E(m 0) ∂ml∂mj ∆ml. (3.19)

Resultando na seguinte equa¸c˜ao generalizada de atualiza¸c˜ao linear do modelo de parˆametros, dada por:

∇E + H∆m = 0, (3.20)

onde ∇E e H s˜ao definidos pelas Equa¸c˜oes 3.6 e 3.11, respectivamente.

Sendo H uma matriz invert´ıvel, a solu¸c˜ao iterativa do problema tem a forma:

o mesmo que:

mk+1 = mk− H−1k ∇Ek, (3.22)

onde o ´ındice k indica a itera¸c˜ao atual e k + 1 a itera¸c˜ao futura.

A matriz Hessiana corrige os efeitos de ilumina¸c˜ao incompleta do alvo e ´e respons´avel pela recupera¸c˜ao das corretas amplitudes do gradiente devido a banda de frequˆencias limitada (PRATT et al., 1998). Para problemas lineares quadr´aticos e pr´oximos `a solu¸c˜ao, ou seja, pr´oximos ao m´ınimo global, o m´etodo de Newton tende a convergir em apenas uma itera¸c˜ao. Entretanto, para problemas inversos n˜ao lineares de grande porte, a solu¸c˜ao requer um grande n´umero de itera¸c˜oes para convergir at´e o m´ınimo.

Apesar dos benef´ıcios em destaque do uso da Hessiana, para problemas de grande porte o c´alculo e armazenamento dos termos da matriz Hessiana, bem como sua invers˜ao est˜ao atrelados a um alto custo computacional. A constru¸c˜ao expl´ıcita da inversa da matriz Hessiana ultrapassa a capacidade computacional atualmente dispon´ıvel, levando a ado¸c˜ao de algumas simplifica¸c˜oes.

MULDER e PLESSIX (2004) contornaram o problema do c´alculo da Hessiana, aproximando-a por sua diagonal principal. O m´etodo Gauss-Newton leva em considera¸c˜ao apenas a Hessiana aproximada, excluindo o termo residual n˜ao linear R e, em adi¸c˜ao, aplicam-se t´ecnicas de regulariza¸c˜oes para estabilizar a n˜ao linearidade (PRATT et al., 1998).

Uma aproxima¸c˜ao eficiente da Hessiana aproximada ´e a diagonal da pseudo-Hessiana, proposta por SHIN et al. (2001), que contribui para preserva¸c˜ao da amplitude para a migra¸c˜ao RTM pr´e-empilhamento. Os m´etodos quasi-Newton fazem aproxima¸c˜oes da matriz Hessiana a cada itera¸c˜ao e, ao contr´ario do m´etodo de Newton, nenhuma derivada de segunda ordem ´e calculada explicitamente e s˜ao obtidas atrav´es de sucessivas itera¸c˜oes.

Por fim, uma abordagem mais simples aproxima a Hessiana por uma matriz identidade, resultando no esquema de atualiza¸c˜ao para o modelo corrente mais geral, apresentando-se como abaixo:

mk+1= mk− αkpk, (3.23)

onde αk representa um fator escalar positivo, denominado comprimento do passo,

que indica o quanto se deve andar na dire¸c˜ao de busca pk a fim de reduzir o valor

b) Comprimento do passo

O comprimento do passo para problemas n˜ao lineares pode ser calculado pela minimiza¸c˜ao da fun¸c˜ao unidimensional:

χ(α) = E(mk− αkpk), (3.24)

de forma que:

E(mk− αkpk) < E(mk). (3.25)

A primeira estimativa do comprimento do passo pode ser definida a partir da raz˜ao entre a m´axima atualiza¸c˜ao do modelo permitida (∆m) e o m´aximo valor absoluto do gradiente. Esta estrat´egia garante que o comprimento do passo seja positivo, mantendo a dire¸c˜ao de decr´escimo do funcional objetivo, al´em de estabelecer uma varia¸c˜ao m´axima ao modelo na primeira itera¸c˜ao.

A solu¸c˜ao do problema de otimiza¸c˜ao na defini¸c˜ao do passo n˜ao ´e trivial e, para tanto, podem ser adotadas estrat´egias de buscas em linha, a fim de encontrar um ponto de m´ınimo da fun¸c˜ao que satisfa¸ca condi¸c˜oes pr´e-estabelecidas, como as descritas por WOLFE (1969). Atrav´es do algoritmo backtracking, descrito por NOCEDAL e WRIGHT (2006), o comprimento do passo ´e reduzido a um fator η (0 < η < 1) at´e que a condi¸c˜ao de decr´escimo seja atingida ou at´e que o n´umero m´aximo de buscas seja realizado.

De acordo com ZHOU et al. (2006), informa¸c˜oes de itera¸c˜oes pr´evias s˜ao valiosas e tamb´em podem ser adotadas para determina¸c˜ao do tamanho do passo. Para tanto, emprega-se uma estrat´egia de regi˜ao de confian¸ca (trust-region) para definir um novo passo a cada itera¸c˜ao a partir da adapta¸c˜ao de duas formula¸c˜oes propostas por BARZILAI e BORWEIN (1988).

c) Dire¸c˜ao de atualiza¸c˜ao

O vetor pk indica a dire¸c˜ao de atualiza¸c˜ao do modelo que varia de acordo

com o algoritmo empregado. Para o m´etodo de m´axima descida (Steepest Descent Method ), o vetor pk corresponde ao negativo do gradiente do funcional objetivo e

tem convergˆencia linear:

pk = −∇E(mk). (3.26)

Visando contornar a baixa taxa de convergˆencia do m´etodo de m´axima descida e evitar dire¸c˜oes de busca recorrentes, pode-se utilizar os gradientes conjugados, onde o vetor pk ´e dado pela seguinte express˜ao:

onde o βk representa um escalar que assegura a ortogonalidade dos vetores e garante

uma convergˆencia mais r´apida em uma quantidade de itera¸c˜oes menor ou igual ao n´umero de parˆametros do modelo, em virtude do uso de informa¸c˜oes das dire¸c˜oes de busca anteriores.

3.4

Invers˜ao

FWI

monoparam´etrica

versus

Documentos relacionados