Avan¸cos em regulariza¸c˜ao de Tikhonov
multiparam´etrica para problemas discretos
mal-postos.
Leonardo Silveira Borges (UNICAMP) Maria Cristina C. Cunha (UNICAMP)
Ferm´ın S. V. Baz´an (UFSC)
UNICAMP
Departamento de Matem´atica Aplicada
Estrutura
1 Introdu¸c˜ao
2 Algoritmo de ponto fixo
3 GKB-FP: problemas de grande porte
4 Extens˜oes de GKB-FP
Estrutura
1 Introdu¸c˜ao
2 Algoritmo de ponto fixo
3 GKB-FP: problemas de grande porte
4 Extens˜oes de GKB-FP
Introdu¸c˜ao
Problema discreto linear mal-posto
Problema discreto linear mal-posto:f = argmin f ∈Rn kg − Af k 2 2 (1) A∈ Rm×n, m ≥ n, mal condicionada. g = gexato + e ∈ Rm.
Consequˆencia: Solu¸c˜ao fLS = A†g sem utilidade.
Alternativa: Tikhonov propˆos substituir (1) por
fλ = argmin f ∈Rn ©kg − Af k 2 2+ λ2kLf k22 ª λ > 0: Parˆametro de regulariza¸c˜ao. L∈ Rp×n: Matriz de regulariza¸c˜ao.
Escolha do parˆametro
M´etodos para escolha de λ
M´etodos cl´assicos:Princ´ıpio da Discrepˆancia (Morozov, 1966) Valida¸c˜ao Cruzada-Generalizada (Golub, 1979) Crit´erio da Curva-L (Hansen, 1993)
Propostas mais recentes:
Ponto-Fixo (Baz´an, 2008, Baz´an e Francisco, 2009) Valida¸c˜ao Cruzada-Generalizada com peso (Chung, 2008)
Comparativo entre 20 m´etodos para escolha de λ: F. Bauer e M. A. Lukas, Comparing parameter choice methods for regularization of ill-posed problems, 2011.
Escolha do parˆametro
Curva-L e o crit´erio do produto m´ınimo
Norma do res´ıduo: x(λ) = kg − Afλk22, fun¸c˜ao crescente
(semi-)Norma da solu¸c˜ao: y(λ) = kLfλk22, fun¸c˜ao decrescente Hansen, 1993: Encontrar o ponto de m´axima curvatura de
L =©(a, b) ∈ R2/a = log x(λ), b = log y (λ)ª
Regi´nska, 1996: Encontrar um minimizador local da fun¸c˜ao Ψ(λ) = x(λ)y (λ)µ, µ > 0 100 100 log x(λ) log y( λ ) Curva−L 100 100 log λ log Ψ ( λ ) Ψ(λ)
Escolha do parˆametro
Justificativa do crit´erio do produto m´ınimo
Solu¸c˜ao regularizada: fλ = (ATA+ λ2LTL)−1ATg = Rλg Cota para o erro:
kfexato − fλk2 = kf exato − Rλg exato − Rλek2 ≤ kfexato − Rλg exato k2+ kRλek2= ξ1(λ) + ξ2(λ) log do crit´erio do produto: log Ψ(λ) = log x(λ) + µ log y (λ)
0 0.02 0.04 0.06 100 101 λmin = 0.01452 0 0.02 0.04 0.06 102.13 102.15 102.17 λmin = 0.023442 ξ1(λ) ξ2(λ) ξ1(λ)+ξ 2(λ) Ψ(λ)
Estrutura
1 Introdu¸c˜ao
2 Algoritmo de ponto fixo
3 GKB-FP: problemas de grande porte
4 Extens˜oes de GKB-FP
Algoritmo de ponto fixo
Ponto Fixo (FP) (Baz´an, 2008 e Baz´an e Francisco, 2009)
Pontos cr´ıticosde Ψ(λ) est˜ao associados aospontos fixos deφ(λ; µ) =√µkg − Afλk2 kLfλk2 100 105 log λ Ψ(λ) 100 10−5 100 log λ φ(λ)
Algoritmo FP: λ0 > 0: chute inicial
λk+1 = φ(λk; µ), k ≥ 0
Estrutura
1 Introdu¸c˜ao
2 Algoritmo de ponto fixo
3 GKB-FP: problemas de grande porte
4 Extens˜oes de GKB-FP
Problema de grande porte
Bidiagonaliza¸c˜ao de Golub-Kahan e LSQR
Bidiag. de Golub-Kahan: No passo k existem matrizes Uk+1 e Vk
com colunas ortonormais e Bk ∈ R(k+1)×k bidiag. inferior tal que
AVk = Uk+1Bk
ATUk+1 = VkBkT+ αk+1vk+1ekT+1
Propriedade: span(Vk) = Kk(ATA, ATb)
Algoritmo LSQR:Construir solu¸c˜oes fk = Vkyk com
yk = argmin y ∈Rk kβ1
e1− Bkyk22
Problema de grande porte
LSQR e Tikhonov
No problema regularizado, construir solu¸c˜oes fk,λ = Vkyk,λ com
yk,λ= argmin y ∈Rk ©kβ
1e1− Bkyk22+ λ2kyk22
ª
em que β1 = kgk2.
Propriedades: para λ ≥ 0 fixo,
kβ1e1− Bkyk,λk2 ´e decrescenteem k
Problema de grande porte
GKB-FP (Baz´an e Borges, 2010)
Para cada k, k ≥ 2, seja yk,λ= argmin
y ∈Rk ©kβ1
e1− Bkyk22+ λ2kyk22
ª
Ideia: aplicar algoritmo FP para selecionar λ(k)∗ ponto fixo de
φ(k)(λ; µ) =√µkβ1e1− Bkyk,λk2 kyk,λk2
Teorema 1: φ(λ; µ) ≤ φ(k+1)(λ; µ) ≤ φ(k)(λ; µ), k = 2, . . . , n − 1, Teorema 2: Sequˆencia de pontos fixos λ(k)∗ ´e n˜ao-crescente
Problema de grande porte
GKB-FP, Estabiliza¸c˜ao da solu¸c˜ao
Teorema 3Se o maior ponto fixo convexo de φ(λ; 1) ´e encontrado no passso k, isto ´e, λ∗ = φ(k)(λ∗; 1) para algum k, ent˜ao
fk,λ∗= fk+1,λ∗ = · · · = fn,λ∗, fλ∗ e como consequˆencia, a norma
do erro kfexato− f
j,λ∗k2 permanece constante para k ≤ j ≤ n.
0 10 20 10−2 10−1 100 λk 0 10 20 101.1 101.2 Norma sol. 0 10 20 10−2 10−1 100 Erro rel.
Estrutura
1 Introdu¸c˜ao
2 Algoritmo de ponto fixo
3 GKB-FP: problemas de grande porte
4 Extens˜oes de GKB-FP
Extens˜oes de GKB-FP
GKB-FP para forma geral (Baz´an e Borges, 2011)
Ideias gerais:1. Transformar o problema na forma geral
fλ = argmin
f ∈Rn ©kg − Af k 2
2+ λ2kLf k22ª , L6= I
para a forma padr˜ao
¯ fλ= argmin ¯ f ∈Rn ©k¯g − ¯A¯fk 2 2+ λ2k¯fk22 ª
2. Aplicar GKB-FPno problema transformado na forma padr˜ao.
3. Obtida solu¸c˜ao ¯fλ, calcular fλ.
Obs: Transforma¸c˜ao para forma padr˜ao envolve c´alculos com a matriz L†.
Extens˜oes de GKB-FP
Regularizador L com estrutura especial
Considerar L com estrutura
L= · In˜⊗ Ld Ld⊗ I˜n ¸ em que Ld ∈ R(˜n−d)טn.
Propriedade 1: Estrutura especial de L permite usar a SVD de Ld.
Ld = UdΣdVdT e encontrar matriz LD com tal que
kLf k2 = kLDfk2 com
LD = D(Vd⊗ Vd)T e D2= ΣTdΣd⊗ I + I ⊗ ΣTdΣd Propriedade 2: Redu¸c˜ao do custo comp. para L†f e L†T
f L†Df = (Vd⊗ Vd)D†f e L† T D f = D †(V d⊗ Vd)Tf
Extens˜oes de GKB-FP
PROJ-FP (Baz´an e Borges, 2011)
Problema naforma geral
fλ = argmin
f ∈Rn ©kg − Af k 2
2+ λ2kLf k22
ª
Ideia: Construir solu¸c˜oes fk,λ= Vkyk,λ com
yk,λ= argmin y ∈Rk ©kβ1 e1− Bkyk22+ λ2kLVkyk22 ª Decomposi¸c˜ao QRde LVk, LVk = QkRk, implica yk,λ = argmin y ∈Rk ©kβ1 e1− Bkyk22+ λ2kRkyk22 ª
Extens˜oes de GKB-FP
G-LSQR (Baz´an e Borges, 2011)
Ideia geral: Aplicar o algoritmo LSQR ao problema
argmin
¯
f ∈Rn k¯g − ¯
A¯fk22
Crit´erio de parada:´Indice k∗ tal que
k∗ = argmin ¯Ψk, k ≥ 0
em que
¯
Ψk = k¯g − ¯A¯fkk2k¯fkk2 Obs: Obtida solu¸c˜ao ¯fk, calcular fk.
Experimento num´erico
Exemplo - Restaura¸c˜ao de imagem
Imagem: 512×512 pixels Sistema linear: 262.144 vari´aveis
N´ıvel ru´ıdo: 0,1% Regularizador: L=
·
I⊗ L1
L1⊗ I
¸
Experimento num´erico
Exemplo - Restaura¸c˜ao de imagem
LD PROJ-FP G-LSQR
E 15,92% 12,53% 15,88%
tempo 18,8s 188,4s 17,6s
itera¸c˜oes 154 171 154
Estrutura
1 Introdu¸c˜ao
2 Algoritmo de ponto fixo
3 GKB-FP: problemas de grande porte
4 Extens˜oes de GKB-FP
Tikhonov Multi-param´etrico
Tikhonov Multi-param´etrico
O problema com v´arios parˆametros:
fλ = argmin f ∈Rn ©kg − Af k 2 2+ λ21kL1fk22+ · · · + λ2qkLqfk22 ª A∈ Rm×n, Li ∈ Rpi×n e λ = (λ1, . . . , λq) ∈ Rq, λi > 0.
Dificuldade: Falta de decomposi¸c˜ao “GSVD” para (A, L1, . . . , Lq)
do tipo A = UΣX , Li = ViMiX, em que U, Vi s˜ao ortogonais, Σ e
Mi diagonais e X n˜ao-singular.
Ideia: Tratar como
fλ = argmin f ∈Rn ° ° ° ° ° ° ° ° ° g 0 .. . 0 − A λ1L1 .. . λqLq f ° ° ° ° ° ° ° ° ° 2 2
Generaliza¸c˜oes
Discrepˆancia para m´ultiplos parˆametros
Escolher λ = (λ1, . . . , λq) tal que a solu¸c˜ao regularizada fλ
satisfa¸ca oPrinc´ıpio da Discrepˆancia
kg − Afλk2 = cδ, c ≥ 1
em que kek = kg − gexato
k22 ≤ δ.
Interpreta¸c˜ao geom´etrica usando 1 e 2 parˆametros:
0 0.02 0.04 0.11 0.115 0.12 λ ||g−Af λ || 0 0.05 0 0.1 0.2 0.11 0.12 0.13 λ2 λ1 ||g−Af λ || ||g−Afλ|| = cδ
Generaliza¸c˜oes
Fun¸c˜oes modelo (Lu e Pereverzev, 2011)
Considerar o caso
fλ = argmin©kg − Af k22+ λ21kL1fk22+ λ22kf k22
ª
A equa¸c˜ao da discrepˆancia pode ser reescrita como
F(λ1, λ2) − λ21∂λ1F(λ1, λ2) − λ 2
2∂λ2F(λ1, λ2) = c
2δ2 (2)
Ideia: aproximar F (λ1, λ2) por uma fun¸c˜ao mais simples,
m(λ1, λ2), chamada de fun¸c˜ao modelo, que seja mais f´acil de
trabalhar. m(λ1, λ2) = kgk22+ C λ2 1 + D T + λ2 2
Generaliza¸c˜oes
Combina¸c˜ao linear (Brezinski, et al., 2003)
Trabalhar comq subproblemas uniparam´etricos
fλi = argmin
f ∈Rn ©kg − Af k 2
2+ qλ2ikLifk22
ª
Obter solu¸c˜ao fλ comocombina¸c˜ao linear das solu¸c˜oes fλi
fλ = fλ(α) = q X i=1 αifλi, s. a q X i=1 αi = 1
Generaliza¸c˜oes
Crit´erio do produto m´ınimo - Ponto Fixo
Sejam
x(λ) = kg − Afλk22, yi(λ) = kLifλk22
Escolher como parˆametro de regulariza¸c˜ao o ponto λ ∈ Rq
minimizador local de
Ψ(λ) = x(λ)y1(λ)µ1· · · yq(λ)µq, µi > 0
Pontos extremosde Ψ(λ) est˜ao associados aos pontos fixos de
Φ(λ) = (φ1(λ; µ1), . . . , φq(λ; µq))
em que
φi(λ; µi) =√µikg − Afλk2
Generaliza¸c˜oes
Pontos extremos de Ψ(λ)
Do c´alculo, λ ´e ponto extremo se ∇Ψ(λ) = 0, ent˜ao
∇Ψ(λ) = yµ1 1 (λ) · · · y µq q (λ)J µ1 x(λ) y1(λ)− λ 2 1 .. . µq x(λ) yq(λ) − λ 2 q = 0 em que J= ∂y1 ∂λ1 · · · ∂yq ∂λ1 .. . . .. ... ∂y1 ∂λq · · · ∂yq ∂λq , n˜ao-singular
Generaliza¸c˜oes
Algoritmo
1. λ(0) = (λ(0)1 , . . . , λ(0)q ) > 0 2. λ(k+1) = (λ(k+1)1 , . . . , λ(k+1)q ) = Φ(λ(k)), isto ´e, λ(k+1)i = φi(λ(k); µi), i = 1, . . . , q em que φi(λ; µi) =√µikg − Afλk2 kLifλk2Generaliza¸c˜oes
Superf´ıcies Ψ(λ), φ
1(λ) e φ
2(λ)
Exemplo de superf´ıcies Ψ(λ), φ1(λ) e φ2(λ) 0.01 0.02 0.03 0.2 0.4 −5 −4 −3 −2 −1 λ2 λ1 −8 −6 −4 −8−6 −4−2 −7 −6 −5 −4 λ2 λ1 −8 −6 −4 −8−6 −4−2 −6 −4 −2 λ2 λ1 FPExperimento num´erico
Exemplo - Equa¸c˜ao integral
Discretiza¸c˜ao da transformada inversa de Laplace (equa¸c˜ao integral de Fredholm de primeira esp´ecie).
Z ∞
0
K(x, y )f (y )dy = g (x), 0 ≤ x < ∞
em que oN´ucleo K(x, y ),Solu¸c˜ao f(y ) eLado direito g(x) s˜ao dados por
K(x, y ) = exp(−xy) f(y ) = exp(−y/2) g(x) = 1
Experimento num´erico
Exemplo - Equa¸c˜ao integral
Sistema linear: 512 vari´aveisN´ıvel ru´ıdo: 1% Regularizadores: L1 = I e L2= L1.
FPL1 FPL2 FP Comb. Linear Discrep.
E 20,42% 4,51% 1,19% 4,50% 3,17% itera¸c˜oes 4 4 6 – 7 λ1 0,0281 0,5571 0,0276 0,0281 0,0389 λ2 – – 0,5581 0,5571 0,0008 0 200 400 0 0.5 1 1.5 exata FP L1 0 200 400 0 0.5 1 1.5 FP C.L.
Trabalhos futuros
Trabalhos futuros
An´alise de erro
Bibliografia
F. S. V. Baz´an, Fixed-point iterations in determining the Tikhonov regularization parameter, Inv. Problems, 24, 2008.
F. S. V. Baz´an e J. B. FRANCISCO, Improved Fixed-point algorithm for determining the Tikhonov regularization parameter, Inv.
Problems, 2009.
F. S. V. Baz´an e L. S. Borges, GKB-FP: an algorithm for large-scale discrete ill-posed problems, BIT, 50, p. 481-507, 2010.
F. S. V. Baz´an e L. S. Borges, Extension of GKB-FP algorithm to general-form Tikhonov regularization, submetido.
C. Brezinski, M. Redivo-Zaglia, G. Rodriguez e S. Seatzu,
Multi-parameter regularization techniques for ill-conditioned linear systems, Numerische Mathematik, 94, p. 203-228, 2003.
S. Lu e S. V. Pereverzev, Multi-parameter regularization and its numerical realization, Numerische Mathematik, 118, p. 1-31, 2011. F. Bauer e M. A. Lukas, Comparing parameter choice methods for regularization of ill-posed problems, Math. and Comp. in Simulation, 81, p. 1795-1841, 2011.
Bibliografia
V. A. Morozov, On the solution of functional equations by the method of regularization, Soviet Math. Dokl., 7, pp. 414-417, 1966. G. H. Golub, M. T. Heath e G. Wahba, Generalized cross-validation as a method for choosing a good ridge parameter, Technometrics, 21, pp. 215-223, 1979.
C. C. Paige e M. A. Saunders, LSQR: An algorithm for sparse linear equations and sparse least squares, ACM Trans. Math. Softw, Vol. 8, No. 1, pp 43-71, 1982.
P. C. Hansen, Rank-deficient and discrete ill-posed problems, SIAM Philadelphia, PA, 1998.
J. Chung, J. G. Nagy, e D. P. O’Leary, A Weighted-GCV Method for Lanczos-Hybrid Regularization, Electronic Transaction on Numerical Analysis, 28, pp 149-167, 2008.