Planejamento do Tratamento por Radioterapia
Atrav´
es de M´
etodos de Pontos Interiores
1Cec´ılia Bollini Barboza Cid
Orientador: Prof. Dr. Aurelio Ribeiro Leite de Oliveira
Instituto de Ciˆencias Matem´aticas e de Computa¸c˜ao
ICMC-USP - S˜ao Carlos
Agradecimentos
Quero manifestar minha gratid˜ao ao meu orientador Professor Dr. Aurelio Ribeiro
Leite de Oliveira pela amizade, cr´ıticas, sugest˜oes e apoio, os quais proporcionaram a
elabora¸c˜ao deste trabalho.
Meus agradecimentos `a minha fam´ılia, especialmente aos meus av´os, Pl´ınio e Izelda,
por todo seu amor, sabedoria, incentivo e ora¸c˜oes.
Um obrigado muito especial ao Alexandre que me apoiou em todo momento, com
muito amor, compreens˜ao e incentivo.
Tamb´em gostaria de agradecer a todos meus companheiros de mestrado que
con-tribu´ıram para realiza¸c˜ao deste trabalho e que se revelaram grandes amigos.
Quero manifestar meu reconhecimento e gratid˜ao a Deus, que sempre me mostrou
o caminho a ser seguido, nunca deixou que eu me esquecesse do quanto a vida ´e realmente
bela, e que ´e verdadeiramente o respons´avel pela realiza¸c˜ao deste trabalho.
Finalmente, gostaria de agradecer ao apoio financeiro do CNPq e a todos que de
Resumo
O objetivo deste trabalho consiste no desenvolvimento, estudo e implementa¸c˜ao de m´etodos
de pontos interiores espec´ıficos para o problema de planejamento do tratamento de cˆancer
por radioterapia. Este ´e um problema de grande porte que cont´em uma estrutura
matri-cial particular. A explora¸c˜ao desta estrutura de forma eficiente obt´em bom desempenho
computacional, atrav´es da redu¸c˜ao da dimens˜ao dos sistemas lineares que devem ser
re-solvidos a cada itera¸c˜ao, agilizando a defini¸c˜ao de um tratamento adequado, uma vez que
tipicamente v´arias simula¸c˜oes s˜ao realizadas antes da defini¸c˜ao de um plano definitivo.
Resultados num´ericos em Matlab ilustram a eficiˆencia desta abordagem em problemas
reais e mostram a superioridade do m´etodo preditor corretor em compara¸c˜ao ao m´etodo
Abstract
In this work, a specialized interior point method is developed for planning cancer
treat-ment by radiotherapy. This is a large-scale problem with a specific matrix structure. That
structure is explored in an efficient way reducing the dimension of the linear system which
must be solved at each iteration speeding up the treatment design since usually several
versions must be solved to obtain a satisfactory plan. Moreover, the system obtained is
sparse, symmetric and positive definite. Numerical results in Matlab illustrate the
effi-ciency of this approach in real problems and show the superiority of the preditor-corrector
Conte´
udo
1 Introdu¸c˜ao 1
1.1 Abordagem por M´etodos de Pontos Interiores . . . 1
2 M´etodos de Pontos Interiores para Programa¸c˜ao Linear 3 2.1 M´etodo de Newton para uma Vari´avel . . . 4
2.2 M´etodo de Newton para V´arias Vari´aveis . . . 5
2.3 M´etodo Primal-Dual Afim Escala . . . 5
2.3.1 M´etodo Primal-Dual Cl´assico . . . 7
2.4 M´etodo Preditor-Corretor . . . 8
2.5 C´alculo das Dire¸c˜oes nos M´etodos de Pontos Interiores . . . 10
3 Um Modelo para Formula¸c˜ao do Tratamento por Radioterapia 13 3.1 Formula¸c˜ao do Modelo . . . 16
3.2 Problema de Otimiza¸c˜ao Linear . . . 18
3.3 Propriedades das Restri¸c˜oes El´asticas . . . 20
3.3.1 Interpreta¸c˜ao das Solu¸c˜oes . . . 20
4 M´etodos de Pontos Interiores Aplicados ao Modelo de Tratamento por Radioterapia 23 4.1 An´alise M´edia . . . 23
4.1.1 O M´etodo Primal-Dual para An´alise M´edia . . . 28
4.1.2 Elimina¸c˜ao de Vari´aveis . . . 30
4.1.3 Resumo do M´etodo de Pontos Interiores . . . 35
4.1.4 M´etodo Preditor-Corretor para An´alise M´edia . . . 36
4.2.1 O M´etodo Primal-Dual para An´alise Absoluta . . . 43
4.2.2 Elimina¸c˜ao de Vari´aveis . . . 45
4.2.3 Resumo do M´etodo de Pontos Interiores . . . 52
4.2.4 M´etodo Preditor-Corretor para An´alise Absoluta . . . 53
5 Resultados Computacionais 55 6 Conclus˜oes 59 6.1 Perspectivas Futuras . . . 59
Cap´ıtulo 1
Introdu¸
c˜
ao
Modelos de programa¸c˜ao linear tem sido usados extensivamente para encontrar bons
planos de tratamento por radioterapia. A primeira formula¸c˜ao proposta como um modelo
de programa¸c˜ao linear ocorreu em 1968 [3]. O objetivo do tratamento ´e eliminar as c´elulas
do tumor atrav´es de radia¸c˜ao ao mesmo tempo em que procura evitar a destrui¸c˜ao de
c´elulas vizinhas saud´aveis tamb´em afetadas pela radia¸c˜ao. Existem atualmente m´aquinas
sofisticadas inspiradas na tomografia computadorizada que emitem radia¸c˜ao ao longo de
todo o corpo do paciente [23], por um lado ampliando as possibilidades de minimiza¸c˜ao
destes efeitos colaterais e por outro aumentando a complexidade de obten¸c˜ao de planos
de tratamento.
Do ponto de vista matem´atico, o desafio consiste em emitir uma alta dosagem
de radia¸c˜ao no tumor, suficiente para sua elimina¸c˜ao, e simultaneamente, minimizar a
radia¸c˜ao nas regi˜oes vizinhas compostas de tecido saud´avel, reduzindo ao m´aximo as
complica¸c˜oes nestas regi˜oes que s˜ao muitas vezes cr´ıticas.
1.1
Abordagem por M´
etodos de Pontos Interiores
Uma vantagem deste problema, do ponto de vista computacional, ´e que ele pode ser
mo-delado como um problema de otimiza¸c˜ao linear [3, 8, 9, 22, 24, 23]. Por outro lado, o tipo
de solu¸c˜ao obtida pelo m´etodo simplex para estes modelos n˜ao corresponde ao tratamento
mais adequado do ponto de vista m´edico porque as vari´aveis n˜ao b´asicas estar˜ao nos seus
m´ınima estabelecida para sua elimina¸c˜ao enquanto parte do tecido saud´avel pode receber
a dosagem m´axima permitida.
Solu¸c˜oes deste tipo s˜ao naturalmente evitadas pelos m´etodos de pontos interiores.
Na presen¸ca de m´ultiplas solu¸c˜oes esses m´etodos convergem para aquelas, em certa
me-dida, distanciadas de v´ertices. Estas seriam as solu¸c˜oes mais adequadas na formula¸c˜ao
de um tratamento, pois as vari´aveis n˜ao tendem a atingir seus limites na presen¸ca de
m´ultiplas solu¸c˜oes. Uma outra vantagem da abordagem por pontos interiores ´e a
possi-bilidade de trabalhar com pontos infact´ıveis durante o processo de otimiza¸c˜ao, facilitando
a identifica¸c˜ao de modelos mal formulados.
Uma motiva¸c˜ao adicional para a abordagem por m´etodos de pontos interiores,
est´a na estrutura matricial bem definida deste problema. Experiˆencias anteriores com o
desenvolvimento de m´etodos de pontos interiores espec´ıficos para uma classe de
proble-mas e a explora¸c˜ao da estrutura matricial dos sisteproble-mas lineares resultantes mostra que
esta abordagem ´e muito bem sucedida em termos da obten¸c˜ao de melhor desempenho
computacional [4, 15, 16, 18, 17, 19, 20, 21].
Este trabalho est´a organizado da seguinte forma: no Capitulo 2 s˜ao discutidos
os m´etodos de pontos interiores para programa¸c˜ao linear. No Capitulo 3 apresentamos
modelos para a formula¸c˜ao do tratamento por radioterapia e discutimos com mais detalhes
o modelo adotado. No Cap´ıtulo 4 os m´etodos de pontos interiores s˜ao aplicados ao
modelo de tratamento por radioterapia. No Capitulo 5 s˜ao apresentados os resultados
computacionais obtidos. Finalmente, no Capitulo 6 s˜ao apresentadas as conclus˜oes e
Cap´ıtulo 2
M´
etodos de Pontos Interiores para
Programa¸
c˜
ao Linear
Neste cap´ıtulo vamos adotar a seguinte forma, denominada padr˜ao, para o problema de
programa¸c˜ao linear:
min cTx
s.a Ax=b
x≥0,
onde, A∈ ℜm×n com posto m e os vetores coluna x, c e b tem a dimens˜ao apropriada.
O dual desse problema ´e dado por:
max bTy
s.a ATy+z =c
z≥0.
Um ponto ´e dito interior quando todas as vari´aveis est˜ao estritamente dentro de
seus limites [27] no problema dual por exemplo z0 > 0 ´e um ponto interior. Um ponto
interior ´e fact´ıvel quando todas as restri¸c˜oes s˜ao satisfeitas, ou seja, o ponto x0, onde,
Ax0 = b com x0 > 0 ´e um ponto interior fact´ıvel. As condi¸c˜oes de otimalidade para
factibilidade primal
b−Ax = 0
x≥0,
factibilidade dual
c−ATy−z = 0
z ≥0,
e condi¸c˜oes de complementaridade [26]
xizi = 0, i= 1· · ·n
ou seja, XZe = 0,
onde, X ´e a matriz diagonal formada pelos elementos do vetor x, Z ´e a matriz diagonal
formada pelos elementos do vetorzee´e o vetor unit´ario,eT = (1,1,1,· · ·,1).Os m´etodos
de pontos interiores primais-duais podem ser desenvolvidos atrav´es aplica¸c˜ao do m´etodo
de Newton `as condi¸c˜oes de otimalidade [27] partindo de um ponto interior desconsiderando
as desigualdades. A n˜ao negatividade das vari´aveis ´e controlada pelo tamanho do passo.
2.1
M´
etodo de Newton para uma Vari´
avel
Antes de desenvolvermos estes m´etodos, apresentaremos uma breve revis˜ao do m´etodo de
Newton. O m´etodo de Newton para uma vari´avel busca zeros de uma fun¸c˜ao resolvendo
equa¸c˜oes da forma,φ(x) = 0. Este m´etodo pode ser deduzido aplicando a s´erie de Taylor
a φ(x) em torno de x0, obtendo:
φ(x) = φ(x0) +φ′(x0)(x−x0) +· · ·
Ignorando os termos de ordem superior temos, para φ(x) = 0 com φ′(x)6= 0 :
−φφ′((xx00)) =x−x0 ⇒x=−
φ(x0)
φ′(x0) +x0
obtendo assim o processo iterativo:
xk+1 =xk− φ(xk)
φ′(xk), onde d
k =−φ(xk)
φ′(xk) ´e a dire¸c˜ao de Newton.
2.2
M´
etodo de Newton para V´
arias Vari´
aveis
O m´etodo de Newton para v´arias vari´aveis tem como objetivo encontrar os zeros de
sistemas de equa¸c˜oes da seguinte forma:
seja, f(x)=0, um conjunto de fun¸c˜oes n˜ao lineares φi(x) onde φi(x) = 0, i= 1,· · · , n.
O m´etodo pode ser deduzido aplicando a s´erie de Taylor para cada φi(x) em torno de x0,
obtendo:
φi(x) =φi(x0) + [∇φi(x0)]T(x−x0) +· · ·, para todo,i= 1· · ·n, onde
∇φi(x0) =
∂φi(x0)
∂x1
...
∂φi(x0)
∂xn
Ignorando os termos de ordem superior temos:
[∇φi(x0)]T(x−x0) =−φi(x0), i= 1,· · · , n.
Onde definimos agora o Jacobiano no ponto x0:
J(x0) =
∇φ1(x0)
...
∇φn(x0)
T
e f(x0) =
φ1(x0)
...
φn(x0)
Podemos resumir assim o m´etodo de Newton:
Dado um ponto inicial x0
Para k = 0,1,· · ·
C´alculo da dire¸c˜ao dk=−J(xk)−1f(xk)
C´alculo do novo ponto xk+1 =xk+dk
at´e convergir
onde um crit´erio de convergˆencia poderia ser kf(xk+1)k/kxk+1k menor que uma dada
tolerˆancia.
2.3
M´
etodo Primal-Dual Afim Escala
Este m´etodo busca a solu¸c˜ao dos problemas de programa¸c˜ao linear primal e dual aplicando
variantes do m´etodo de Newton `as condi¸c˜oes de otimalidade, e modificando o tamanho
da seguinte forma,
f(x, y, z) =
Ax−b ATy+z−c
XZe
= 0.
Aplicando o m´etodo de Newton a este sistema de equa¸c˜oes n˜ao lineares obtemos:
(x, y, z) = (x0, y0, z0)−(J(x0, y0, z0))−1f(x0, y0, z0) = (x0, y0, z0)−d0.
onde,
−f(x0, y0, z0) =−
Ax0−b
ATy0+z0−c
X0Z0e
= r0 p r0 d r0 a
≡r0.
A dire¸c˜ao do m´etodo de Newton aplicado `as equa¸c˜oes f(x,y,z) torna-se:
J(x0, y0, z0)d0 =
A 0 0
0 AT I
Z0 0 X0
d0 x d0 y d0 z = r0 p r0 d r0 a logo,
d0 =
d0 x d0 y d0 z =
A 0 0
0 AT I
Z0 0 X0
−1 r0 p r0 d r0 a .
Podemos assim resumir o m´etodo de pontos interiores primal-dual afim escala:
dado um ponto interior (x0, y0, z0) onde (x0, z0)>0
Para k = 0,1,· · ·
rk
p =b−Axk
rk
d =c−ATyk−zk
rk
a =−XkZke
dk =J−1(xk, yk, zk)rk
calcule o tamanho do passo primal αk
p e dual αkd
xk+1 =xk+αk pdkx
yk+1 =yk+αk ddky
at´e convergir.
O crit´erio de convergˆencia usado neste m´etodo ´e baseado nas condi¸c˜oes de otimalidade:
xtz
1+ctx+bty
≤ǫ
kb−Axk
1 +kbk ≤ǫ, kc−Aty−zk
1 +kck ≤ǫ,
onde ǫ ´e a tolerˆancia desejada e xtz uma medida da condi¸c˜ao de complementaridade.
O tamanho do passo αk
p, αkd ´e calculado da seguinte forma:
primeiramente calculamos:
ρkp = min dxk
i<0
− x
k i
dxk i
, (2.1)
e em seguida,
ρk
d= min dzk
i<0
− z
k i
dzk i
. (2.2)
Os valores ρk
p e ρkd representam o tamanho de passo m´aximo tal que a primeira vari´avel
de x e z se anulam respectivamente.
Portanto, o tamanho do passo ser´a obtido multiplicando ρ por um parˆametro τ ∈
(0,1):
αk
p =min(1, τ ρkp) e
αk
d =min(1, τ ρkd)
(2.3)
o que garante que nenhuma vari´avel de x ou z se anule. Adicionalmente, o passo ´e limitado
ao tamanho m´aximo 1, que corresponde a um passo de newton.
2.3.1
M´
etodo Primal-Dual Cl´
assico
O m´etodo afim-escala tˆem uma desvantagem importante: ele permite que as vari´aveis
(x,z) se aproximem de seus limites muito rapidamente. Conseq¨uentemente as dire¸c˜oes
calculadas s˜ao muito distorcidas e o m´etodo converge lentamente, pois xizi ≈ 0. Para
evitar que isto ocorra ´e acrescentada uma perturba¸c˜ao (µ) na condi¸c˜ao de
resolve o seguinte sistema de equa¸c˜oes n˜ao lineares a cada itera¸c˜ao:
b−Axk = 0
c−Atyk−zk = 0
µke−XkZke= 0,
onde µk ´e um parˆametro que varia a cada itera¸c˜ao µk → 0 quando k → ∞. As ´unicas
altera¸c˜oes do m´etodo primal-dual cl´assico em rela¸c˜ao ao m´etodo afim-escala s˜ao a
substi-tui¸c˜ao de rk
a por rkc =µke−XkZke e o c´alculo da pertuba¸c˜aoµk =σk γ
k
n, onde γ
k =xtz,
σ ∈(0,1), o valor γnk seria uma “medida” da distˆancia m´edia de um ponto a uma solu¸c˜ao ´otima. ´E importante ressaltar que o Jacobiano permanece o mesmo o que significa que
ambos m´etodos necessitam resolver sistemas lineares com a mesma matriz.
2.4
M´
etodo Preditor-Corretor
O m´etodo preditor-corretor [13] ´e o m´etodo de pontos interiores mais utilizado na pr´atica,
pois obt´em os melhores resultados computacionais e tem convergˆencia quadr´atica
con-siderando a resolu¸c˜ao de dois sistemas lineares em uma ´unica itera¸c˜ao.
Este m´etodo calcula uma dire¸c˜ao com trˆes componentes [27]:
• dire¸c˜ao afim-escala,
• dire¸c˜ao de centragem (σ),
• dire¸c˜ao de corre¸c˜ao que compensa a aproxima¸c˜ao linear do m´etodo de Newton, que pode ser visualizada pela rela¸c˜ao (x+dx)t(z+dz) = dtxdz.
No m´etodo preditor corretor calcula-se primeiro a dire¸c˜ao afim escala( ˜d= ˜dx,d˜y,d˜z):
Ad˜x =rp
Atd˜
y+ ˜dz =rd
Zd˜x+Xd˜z =ra =−XZe
(2.4)
Usando o mesmo Jacobiano encontra-se em seguida a dire¸c˜ao perturbada no ponto,
ou seja:
Adˆx =rp =b−Ax˜=b−A(x+ ˜dx) = 0
Atdˆ
y+ ˆdz =z−ATy˜−z˜= 0
Zdˆx+Xdˆz =µe−(X+ ˜Dx)(Z+ ˜Dz)e =µe−D˜xD˜ze
onde, µe´e a dire¸c˜ao de centragem e (X+ ˜Dx)(Z+ ˜Dz) representa a corre¸c˜ao n˜ao linear.
A dire¸c˜ao utilizada ser´a a soma das duas dire¸c˜oes:
dx = ˜dx+ ˆdx,
dy = ˜dy+ ˆdy,
dz = ˜dz+ ˆdz.
Logo, (dx, dy, dz), podem ser calculados diretamente somando o dois sistemas lineares:
Adx =rp
Atd
y+dz =rd
Zdx+Xdz =ra+µe−D˜xD˜ze=rs.
(2.5)
ou seja, n˜ao ´e necess´ario que ˆd= ( ˆdx,dˆy,dˆz) seja calculada.
O c´alculo da perturba¸c˜ao µk ´e fun¸c˜ao da dire¸c˜ao afim [13]. Quanto melhor a dire¸c˜ao
menor ser´a a perturba¸c˜ao e vice-versa: considere,
µk =σk γk
n; ˜γ
k = (xk+ ˜αk
pdkx˜)t(zk+ ˜αkddk˜z)
onde, ˜αk
p e ˜αkd s˜ao o tamanho do passo em rela¸c˜ao ao problema primal e dual,
respectiva-mente para a dire¸c˜ao afim, calculados da seguinte forma:
˜
ρkp = min dxk
i<0
− x˜i
k
dx˜ik
e ρ˜kd= min dzk
i<0
− z˜i
k
dz˜ik
, sendo α˜kp = min(1, τρ˜ k
p) e α˜ k
d = min(1, τρ˜ k d),
com τ ∈(0,1). E,
σk =
(γγ˜kk)3, se γk>1
γk
√
n, caso contr´ario.
(2.6)
A id´eia desse m´etodo ´e calcular a dire¸c˜ao afim-escala e estudar o progresso do m´etodo ao
longo dessa dire¸c˜ao, calculando a perturba¸c˜aoµk de acordo com este progresso. Uma vez
que uma segunda dire¸c˜ao ´e calculada, tamb´em calcula-se a corre¸c˜ao n˜ao linear utilizando
o mesmo Jacobiano da dire¸c˜ao anterior [13]. Por outro lado, se γk < 1 existem raz˜oes
te´oricas para calcular uma perturba¸c˜ao proporcional a (γk)2 [25], explicando assim a
Podemos resumir o m´etodo preditor-corretor da seguinte forma:
Dados τ ∈(0,1),(x0, y0, z0) tal que (x0, z0)>0
para k = 0,1,· · ·
rk
p =b−Axk
rk
d =c−ATyk−zk
rk
a =−XkZke
Calcule ˜dk usando (2.4)
Calcule ˜αk p,α˜kd
˜
γk = (xk+ ˜αk
pdkx˜)t(zk+ ˜αkddkz˜)
Calcule µk usando (2.6)
rk
s =µke+rka−D˜xkDz˜ke Calcule dk usando (2.5)
Calcule αk p, αkd
xk+1 =xk+αk pdkx
yk+1 =yk+αk ddky
zk+1 =zk+αk ddkz
at´e convergir.
O crit´erio de convergˆencia ´e o mesmo dos m´etodos primais-duais.
2.5
C´
alculo das Dire¸
c˜
oes nos M´
etodos de Pontos
In-teriores
O sistema linear (2.5) tem dimens˜ao 2n+m. Este sistema pode ser reduzido `a dimens˜ao
m atrav´es das seguintes rela¸c˜oes:
dy = (AD−1AT)−1(rp+AD−1rd−AZ−1rs)
dx =D−1(ATdy−rd+X−1rs)
dz =X−1(rs−Zdx),
obtidas eliminando-se dz e dx sucessivamente onde D=X−1Z.
Essas simplifica¸c˜oes tamb´em s˜ao v´alidas para os m´etodos primal-dual afim escala
e cl´assico. A ´unica altera¸c˜ao ser´a do res´ıduo rs que representa os valores ra erc,
onde uma matriz sim´etrica definida positiva (AD−1AT) deve ser decomposta a cada
ite-ra¸c˜ao. Usualmente ´e utilizada a decomposi¸c˜ao de Cholesky [7] na resolu¸c˜ao deste sistema
Cap´ıtulo 3
Um Modelo para Formula¸
c˜
ao do
Tratamento por Radioterapia
Neste cap´ıtulo s˜ao apresentados alguns modelos de programa¸c˜ao linear para o tratamento
por radioterapia.
O primeiro passo no desenvolvimento de um plano de tratamento ´e definir a
lo-caliza¸c˜ao do tumor e da regi˜ao de risco (estrutura cr´ıtica). Em seguida, a dose do raio
´e calculada individualmente conforme cada paciente. Uma formula¸c˜ao para programa¸c˜ao
linear consiste em minimizar a dose total emitida sujeito a um limite inferior da dose na
regi˜ao do tumor. Este modelo pode ser representado pela seguinte formula¸c˜ao:
min f =Pm
i=1
Pm
j=1Dij
s. a Dij =Pnp=1ωpApij ∀(i, j)
l≤Dij ∀(i, j)∈Γ
w≥0,
onde,
Dij representa a dosagem total recebida pelo paciente na posi¸c˜ao (i, j);
Aij representa a dosagem nominal emitida pelo raio p na posi¸c˜ao (i, j);
w representa a pondera¸c˜ao da dosagem emitida pelos raios;
l representa a dosagem m´ınima a ser recebida pelo tumor;
Γ representa o subconjunto de posi¸c˜oes onde se encontra o tumor;
Figura 3.1: Uma representa¸c˜ao de aparelho de tratamento para radioterapia
m representa o n´umero total de pixels.
Definindo os seguintes subconjuntos:
• R representa o subconjunto de posi¸c˜oes onde se encontra tecido cr´ıtico (saud´avel) ou estrutura cr´ıtica;
• N representa o subconjunto de posi¸c˜oes onde se encontram os demais tecidos saud´aveis; ´e poss´ıvel formular um modelo com pondera¸c˜oes em cada regi˜ao do paciente privilegiando
ou penalizando algumas ´areas quanto `a quantidade de dosagem a ser recebida.
Em [23] s˜ao apresentados outros modelos de otimiza¸c˜ao linear que consistem em
pequenas varia¸c˜oes do modelo acima, tendo em mente o aparelho mostrado na Figura 3.1.
Suponha uma matriz de pixels de imagem n×n, e que os ˆangulos avaliados s˜ao
θ1, θ2, θ3,· · · , θρ. Al´em disso, supomos que cada ˆangulo est´a composto porηsub-raios. Os
sistemas de tratamento modernos s˜ao capazes de realizar combina¸c˜oes complexas entre
estes sub-raios. A geometria de um modelo usando raios elementares, onde n=2, ρ= 4 e
η = 4, ´e indicada na Figura 3.2. Os intervalos entre os ˆangulos ´e π
4, e o ˆangulo inicial ´e
(usualmente) zero.
Seja x(a,i) a dose ao longo do i-´esimo sub-raio doa-´esimo ˆangulo (a = 1, 2, . . . , p)
e d(p,a,i) a distˆancia entre o sub-raio x(a,i) e a imagem do pixel p. Definimos A(p,a,i) como
o produto de e−µd(p,a,i) e a ´area geom´etrica comum a ambos os sub-raios x
(a,i) e o pixel p.
Por exemplo, na Figura 3.2 o raio hachurado correspondente a x(1,2) atinge a metade do
pixel 3 e a distˆancia deste pixel a este raio elementar ´e 3√2
2 (supondo que cada pixel tenha
a mesma largura igual a 1). Conseq¨uentemente, A(3,1,2) = 12e−
3√2
1 2 3 4 x x x x x x x x x x x x x x (2,4) (2,3) (2,2) (2,1) (1,4) (1,3) (1,2) x(1,1) (4,4) (4,3) (4,1) x (3,4) (3,3) (3,2) (3,1) (4,2)
Figura 3.2: Geometria de uma imagem depixel 2×2 com ˆangulosπ
4, 3π 4 , 5π 4 e 7π 4 .
matriz de propaga¸c˜ao dos raios, denotada por A, s˜ao A(p,a,i), onde as linhas de A s˜ao
indexadas por p e as colunas s˜ao indexadas por (a,i). O fator e−µd(p,a,i) mede atenua¸c˜ao
da radia¸c˜ao sobre o tecido, e os valores deste coeficiente de atenua¸c˜ao, (µ), dependem
da energia do raio. O coeficiente de atenua¸c˜ao define a caracter´ıstica do tecido, ou seja,
com rela¸c˜ao a sua densidade. Podemos tomar como exemplo o Raio-X: quanto menor a
densidade do tecido menor o coeficiente de atenua¸c˜ao, portanto queimar´a mais o filme e
conseq¨uentemente este ficar´a mais escuro; quanto maior a densidade do tecido maior o
coeficiente de atenua¸c˜ao, portanto queimar´a menos o filme ficando mais claro.
A matriz dose de propaga¸c˜ao sem atenua¸c˜ao (µ=0) do exemplo da Figura 3.2, ´e
dada por:
0 0 1
2 1 2 0 1 2 1 2 0 1 2 1
2 0 0 0
1 2
1 2 0
0 12 12 0 12 12 0 0 0 12 12 0 0 0 12 12
0 1
2 1
2 0 0 0
1 2 1 2 0 1 2 1 2 0 1 2 1
2 0 0 1
2 1
2 0 0 0
1 2
1
2 0 0 0
1 2 1 2 0 1 2 1 2 0 .
Os elementos de x podem ser ordenados da seguinte forma:
[x(1,1) x(1,2) · · · x(1,r) x(2,1) · · · x(2,r) · · · x(ρ,1) · · · x(ρ,r)], assim a dose de radia¸c˜ao no
pixel p´e o p-´esimo componente de Ax.
Embora a matriz de propaga¸c˜ao da dose permita modelar facilmente os limites
superior e inferior da radia¸c˜ao para algum pixel na imagem, elaborar um plano de
que o tumor n˜ao receba menos do que 80 Gy, onde Gy ´e a dose absorvida, usualmente
medida em joules por quilograma (J/kg), tamb´em denominada gray (Gy): 1Gy = 1 J/kg.
Por outro lado, o plano de tratamento pode n˜ao permitir que alguma estrutura cr´ıtica
receba mais do que 40 Gy.
A maioria das pesquisas tem utilizado modelos de otimiza¸c˜ao com restri¸c˜oes
linea-res, com uma das duas fun¸c˜oes objetivos mais evidente, maximiza¸c˜ao da dose no tumor ou
minimiza¸c˜ao da dose na estrutura cr´ıtica. Uma vez que esta maximiza¸c˜ao leva geralmente
a altas doses, outros trabalhos buscam maximizar a dose m´ınima do tumor ou minimizar
a dose m´axima da estrutura cr´ıtica [10].
As metas listadas abaixo indicam que este problema tem uma grande quantidade
de parˆametros a considerar na decis˜ao do que seria desej´avel para um plano de tratamento:
• Transmitir uma dose uniformemente letal na regi˜ao do tumor.
• Transmitir uma radia¸c˜ao t˜ao pequena quanto poss´ıvel na estrutura cr´ıtica.
• Obter uma dose total t˜ao pequena quanto poss´ıvel.
• Reduzir a freq¨uˆencia de doses altas fora da regi˜ao do tumor.
• Controlar o n´umero de raios utilizados no plano de tratamento.
O objetivo mais comum adotado na pr´atica consiste em transmitir a maior radia¸c˜ao
poss´ıvel no tumor [23]. H´a duas raz˜oes para evitar este objetivo. Normalmente altos
n´ıveis de radia¸c˜ao podem conduzir uma grande soma de necrose, e o corpo humano tem
dificuldade na elimina¸c˜ao de um grande volume de tecido morto. Al´em disso, c´elulas
doentes est˜ao distribu´ıdas entre tecidos saud´aveis. Conseq¨uentemente, uma dose letal
uniformemente distribu´ıda na regi˜ao do tumor ´e crucial para o sucesso do plano de
trata-mento, pois, uma dose inferior permite que a c´elula cancerosa sobreviva enquanto uma
dose superior pode ter efeitos altamente indesej´aveis nos tecidos vizinhos.
3.1
Formula¸
c˜
ao do Modelo
Suponha que cada ´org˜ao do corpo humano est´a dividido por pixels, onde cada pixel
n´umero de pixels do tumor,mC o n´umero de pixels da estrutura cr´ıtica emG o n´umero de
pixels restantes (tecido saud´avel), ou seja, m=mG+mT+mC. Finalmente n, representa
o n´umero de sub-raios para atingir o alvo. A prescri¸c˜ao ´e definida por quatro limites:
•
u
t: representa o vetor de limite superior para radia¸c˜ao no tumor (ut∈ ℜmT);•
l
t: representa o vetor de limite inferior para radia¸c˜ao no tumor (lt∈ ℜmT);•
u
c: representa o vetor de limite superior para radia¸c˜ao na estrutura cr´ıtica (uc ∈ ℜmC);•
u
g: representa o vetor de limite superior para radia¸c˜ao no restante de tecido saud´avel(ug ∈ ℜmG).
Fazemos as suposi¸c˜oes ´obvias que 0 < lt ≤ ut, uc ≥ 0, e ug ≥ 0. Se uma dose letal
uniforme ´e transmitida ao tumor, o limite superior e inferior para os pixels do tumor
s˜ao obtidos atrav´es das metas estabelecidas. Supondo que as metas estabelecidas para
uma c´elula cancerosa sejam tg, os valores de uti e lti s˜ao geralmente (1 +ǫ)tg e (1−ǫ)tg, respectivamente, onde, ǫ ´e a porcentagem da varia¸c˜ao para a dosagem do tumor e ´e
denominadon´ıvel de uniformidade do tumor. Valores t´ıpicos deǫencontrados na literatura
v˜ao de 0.02 `a 0.15 [8]. O vetor ug representa a maior quantidade de radia¸c˜ao permitida
para algum pixel (saud´avel). Em geral tecidos saud´aveis n˜ao devem receber mais do que
10% da dose estabelecida para o tumor. Ou seja, ug =tg(1 + 0.10).
As linhas da matriz de propaga¸c˜ao da dose podem ser reordenadas considerando
as linhas que correspondem ao tumor, as linhas que correspondem `a estrutura cr´ıtica, e
as linhas que correspondem ao tecido saud´avel. Esta reordena¸c˜ao ´e representada pelas
sub-matrizes AT, AC eAG, como indicado abaixo:
A=
AT
AC
AG
ou seja, AT : tumor, AC : estrutura cr´ıtica e AG : restante de tecido saud´avel.
Sub-raios que n˜ao atingem o tumor s˜ao removidos pela elimina¸c˜ao das colunas de
A que tem o vetor zero na coluna correspondente da submatrizAT. Assim, sem perda de
generalidade, consideraremos que a matriz AT n˜ao tem colunas nulas. Portanto, temos
que A∈ ℜm×n, A
3.2
Problema de Otimiza¸
c˜
ao Linear
Um novo modelo de programa¸c˜ao linear usado para auxiliar no plano de radioterapia foi
introduzido em [8]. Este modelo incorpora restri¸c˜oes el´asticas, e quando resolvidas pelo
m´etodo de pontos interiores, produzem planos favor´aveis. A fun¸c˜ao objetivo ´e
represen-tada pela soma ponderada de trˆes metas: lTt, que mede o quanto falta para que o plano
encontrado consiga aplicar a dose m´ınima na regi˜ao do tumor;uT
ccque mede a quantidade
de radia¸c˜ao acima da prescrita recebida pela regi˜ao cr´ıtica; e uT
gg que mede a quantidade
de radia¸c˜ao acima da prescrita nos demais tecidos saud´aveis. O escalar positivo w
pon-dera a importˆancia da formula¸c˜ao de um plano que obtenha a dose m´ınima na regi˜ao do
tumor, isto ´e, valores grandes de w for¸cam lTt a ser t˜ao pequeno quanto poss´ıvel. Seria
desej´avel que existisse valor para um finito w > 0 tal que o valor ´otimo da componente
lTtfosse zero o que garantiria ao tumor receba o n´ıvel m´ınimo de radia¸c˜ao necess´ario para
sua elimina¸c˜ao. O modelo proposto pode ser representado pela seguinte formula¸c˜ao:
min wlTt+uT
cc+uTgg
s.a lt−Lt≤ATx≤ut
ACx≤uc+UCc
AGx≤ug+UGg
0≤Lt≤lt
−uc ≤UCc
UGg ≥0
x≥0.
(3.1)
onde,
w: escalar positivo,
x: dose do sub-raio que entra na imagem para alcan¸car o pixel p, (x∈ ℜn);
t: t∈ ℜmT, t≥0;
c: c∈ ℜmC;
g: g ∈ ℜmG, g ≥0;
As restri¸c˜oeslt−Lt ≤ATx, ACx≤uc+UCc, e AGx≤ug+UGg, s˜ao denominadas
el´asticas, pois seus limites podem variar de acordo com os vetorest,c, eg, respectivamente.
penaliza¸c˜ao ou recompensa com rela¸c˜ao `a elasticidade. Valores fixos de l, uc, ug, L, UC
e UG definem um conjunto de fun¸c˜oes el´asticas. E estas s˜ao incorporadas pelas seguintes
raz˜oes: 1) a restri¸c˜ao el´astica garante que algum conjunto de fun¸c˜oes el´asticas, (3.1) ´e
sempre estritamente fact´ıvel; 2) a diferen¸ca dos limites inferiores nas fun¸c˜oes el´asticas nos
permitem incorporar diferentes objetivos de tratamento.
Considerando que conjuntos diferentes de fun¸c˜oes el´asticas determinam diferentes
filosofias de tratamento a interpreta¸c˜ao do modelo (3.1) depende da escolha deste conjunto.
Em [8] foram propostas as seguintes escolhas, an´alise m´edia e an´alise absoluta.
Na an´alise m´edia,
l= 1
mTe,onde l ∈ ℜ
mT;
uc = m1
Ce,onde uC ∈ ℜ
mC;
uG= m1
Ge,onde uG ∈ ℜ
mG; (3.2)
L=I,onde L∈ ℜmT×mT;
UC =I,onde UC ∈ ℜmC×mC;
UG =I,onde UG ∈ ℜmG×mG.
sendo I a matriz identidade. Esta escolha tem os seguintes objetivos:
• minimizar a dosagem m´edia recebida pelo tumor dentro do limite prescrito;
• minimizar a dosagem m´edia da radia¸c˜ao que a estrutura cr´ıtica recebe, e
• minimizar a dosagem m´edia que o tecido saud´avel recebe. Na an´alise absoluta,
l =emT,onde l∈ ℜ
mT;
uc =emC,onde uC ∈ ℜ
mC;
uG =emG,onde uG∈ ℜ
mG; (3.3)
L=emTe
T
mT,onde L∈ ℜ
mT;
UC =emCe
T
mC,onde UC ∈ ℜ
mC;
UG=emGe
T
mG,onde UG∈ ℜ
mG.
• minimizar a dosagem m´axima recebida pelo tumor dentro do limite prescrito;
• minimizar a dosagem m´axima da radia¸c˜ao que a estrutura cr´ıtica recebe, e
• minimizar a dosagem m´axima recebida pelo tecido saud´avel.
3.3
Propriedades das Restri¸
c˜
oes El´
asticas
Considere a seguinte defini¸c˜ao:
Defini¸c˜ao A prescri¸c˜ao (ut, lt, uc, ug) admite a uniformidade do tratamento do tumor se
existe um plano, x≥0, tal quelt≤ATx≤ut.
O Teorema abaixo foi demonstrado em [8].
Teorema 3.3.1 Seja(x∗(w), t∗(w), c∗(w), g∗(w))uma solu¸c˜ao ´otima de (3.1). Para
qual-quer conjunto de fun¸c˜oes el´asticas temos que lTt∗(w) = O(1
w), desde que a prescri¸c˜ao
admita a uniformidade do tratamento do tumor.
Este Teorema mostra que se a prescri¸c˜ao do tratamento ´e vi´avel, o d´eficit de radia¸c˜ao no
tumor ´e uniformemente limitada pelo inverso de w. Utilizando este resultado ´e poss´ıvel,
resolvendo apenas um problema de programa¸c˜ao linear, interpretar o resultado e concluir
se existe um tratamento que atende `a prescri¸c˜ao violando ou n˜ao os limites ug e uc [8].
3.3.1
Interpreta¸
c˜
ao das Solu¸
c˜
oes
Em [8] Holder mostra que quando w= κǫ e o valor ´otimo delTt ´e menor do que ǫ, ent˜ao
a uniformidade na regi˜ao do tumor ´e garantida, onde κ ´e uma constante que depende
dos dados do problema. Portanto, dados w como definido acima e solu¸c˜ao do problema
linear correspondente, podemos interpretar a solu¸c˜ao para as an´alises m´edia e absoluta
da seguinte forma:
An´alise M´edia
(l =e, uc =e, ug =e)
Caso 1: lTt∗(w)> ǫ, conclu´ımos que a prescri¸c˜ao n˜ao permite a uniformidade do tumor.
Esta situa¸c˜ao cont´em dois importante subcasos:
Caso 2a: uT
cc∗(w) +uTgg∗(w)>0, a conclus˜ao ´e que a uniformidade do tumor ´e acess´ıvel,
mas ´e cara, pois tecidos saud´aveis est˜ao recebendo mais radia¸c˜ao do que desejado.
Caso 2b: uT
cc∗(w) +uTgg∗(w)≤0, a conclus˜ao ´e que a uniformidade do tumor ´e permitida,
a soma m´edia de radia¸c˜ao sobre o tecido saud´avel ´e no m´ınimo t˜ao boa quanto desejada.
An´alise Absoluta
(l =uc =ug = 1)
Caso 1: t∗(w)> ǫ, mesma interpreta¸c˜ao da an´alise m´edia.
Caso 2: t∗(w)≤ǫ, idem. Esta situa¸c˜ao cont´em dois importante subcasos:
Caso 2a: uT
cc∗(w) +uTgg∗(w)>0, mesma interpreta¸c˜ao da an´alise m´edia.
Caso 2b: uT
Cap´ıtulo 4
M´
etodos de Pontos Interiores
Aplicados ao Modelo de Tratamento
por Radioterapia
Neste cap´ıtulo aplicaremos os m´etodos de pontos interiores para o modelo (3.1)
con-siderando duas situa¸c˜oes a an´alise m´edia e an´alise absoluta.
4.1
An´
alise M´
edia
Adotamos inicialmente a an´alise m´edia(3.2), descrita no Cap´ıtulo 3. Com esta escolha o
problema (3.1) se reduz a:
min wm1
Te
Tt+ 1
mCe
Tc+ 1
mGe
Tg
s.a lt−t≤ATx≤ut
ACx≤uc+c
AGx≤ug+g
0≤t≤lt
−uc ≤c
(g, x)≥0.
Nosso pr´oximo objetivo consiste em obter um problema de programa¸c˜ao linear na forma
canalizada por lt−t ≤a≤ut e uc+c= ˜c⇒c= ˜c−uc, teremos ent˜ao:
min w 1
mTe
Tt+ 1
mCe
T(˜c−u c) + m1
Ge
Tg
s.a lt−t≤a≤ut
ATx=a
ACx≤c˜
AGx≤ug+g
0≤t≤lt
(˜c, g, x)≥0.
Introduzimos as vari´aveis de folga e desconsideramos a constanteeTu
c, obtendo o problema
primal:
min w 1
mTe
Tt+ 1
mCe
Tc+ 1
mGe
Tg
s.a a+su =ut
a+t−sl =lt
ATx−a= 0
ACx+sc−c= 0 (4.1)
AGx−g+sg =ug
t+st =lt
(t, c, g, x, su, sl, sc, sg, st)≥0,
onde sem perda de generalidade substitu´ımos ˜cpor c. Primeiramente escrevemos a matriz
de restri¸c˜oes de (4.1):
M =
I 0 0 0 0 I 0 0 0 0
I 0 I 0 0 0 −I 0 0 0
−I AT 0 0 0 0 0 0 0 0
0 AC 0 −I 0 0 0 I 0 0
0 AG 0 0 −I 0 0 0 I 0
0 0 I 0 0 0 0 0 0 I
Encontraremos agora o problema dual. Multiplicando a transposta de M, por y, o vetor
Mty=
I I −I 0 0 0
0 0 At
T AtC AtG 0
0 I 0 0 0 I
0 0 0 −I 0 0
0 0 0 0 −I 0
I 0 0 0 0 0
0 −I 0 0 0 0
0 0 0 I 0 0
0 0 0 0 I 0
0 0 0 0 0 I
yu yl ya yc yg yt ou seja,
yu+yl−ya= 0
At
Tya+AtCyc+AtGyg ≤0
yl+yt≤wm1Te
−yc ≤ m1Ce
−yg ≤ m1Ge
yu ≤0
−yl ≤0
yc ≤0
yg ≤0
yt ≤0.
Definindo,
substituindo no sistema anterior, obtemos:
−y˜u+yl−ya = 0
At
Tya−AtCy˜c−AtGy˜g ≤0
yl−y˜t ≤wm1
Te ˜
yc ≤ m1
Ce ˜
yg ≤ m1
Ge ( ˜yu, yl,y˜c,y˜g,y˜t)≥0.
Isso implica que:
−y˜u+yl−ya = 0
At
Tya−AtCy˜c−AtGy˜g ≤0
yl−y˜t ≤wm1Te
0≤y˜c ≤ m1Ce
0≤y˜g ≤ m1Ge
( ˜yu, yl,y˜t)≥0.
Introduzindo agora as vari´aveis de folga z e wtemos:
−y˜u+yl−ya = 0
At
Tya−AtCy˜c−AtGy˜g+zx = 0
yl−y˜t+zt=wm1
Te
˜
yc +wc = m1
Ce
˜
yg +wg = m1
Ge
( ˜yu, yl,y˜c,y˜g,y˜t)≥0
(zx, zt)≥0
Sem perda de generalidade, tomamos ˜yu = yu; ˜yc = yc; ˜yg = yg; ˜yt = yt e, encontramos
finalmente o problema dual no formato desejado:
max −ut
tyu+lttyl−utgyg−lttyt
s.a −yu+yl−ya= 0
At
Tya−AtCyc−AtGyg+zx = 0
yl−yt+zt =wm1
Te (4.2)
yc+wc = m1
Ce
yg+wg = m1
Ge
(yu, yl, yc, yg, yt, zx, zt, wc, wg)≥0.
As condi¸c˜oes de complementaridade [27] para os problemas (4.1) e (4.2) s˜ao dadas por:
YuSue= 0; YlSle= 0
YcSce= 0; YgSge = 0; YtSte = 0
XZxe= 0; T Zte = 0;
CWce= 0; GWge= 0.
(4.3)
As condi¸c˜oes de otimalidade para os problemas (4.1) e (4.2) s˜ao dadas pela factibilidade
primal:
a+su =ut
a+t−sl =lt
ATx−a= 0
ACx+sc−c= 0
AGx−g+sg =ug
t+st =lt
(t, c, g, x, su, sl, sc, sg, st)≥0,
factibilidade dual:
−yu+yl−ya = 0
At
Tya−AtCyc−AtGyg +zx = 0
yl−yt+zt=wm1
Te
yc+wc = m1Ce
yg+wg = m1
Ge
4.1.1
O M´
etodo Primal-Dual para An´
alise M´
edia
Agora, seguindo os passos descritos no Cap´ıtulo 2, determinamos as dire¸c˜oes do m´etodo primal-dual, para os problemas (4.1) e (4.2) escrevendo primeiramente o Jacobiano:
J=
I 0 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 0
I 0 I 0 0 0 −I 0 0 0 0 0 0 0 0 0 0 0 0 0
−I AT 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 AC 0 −I 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 AG 0 0 −I 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0
0 0 I 0 0 0 0 0 0 I 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 −I I −I 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 At
T −AtC −AtG 0 I 0 0 0
0 0 0 0 0 0 0 0 0 0 0 I 0 0 0 −I 0 I 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 I 0 0 0 0 I 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 I 0 0 0 0 I
0 0 0 0 0 Yu 0 0 0 0 Su 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 Yl 0 0 0 0 Sl 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 Yc 0 0 0 0 0 Sc 0 0 0 0 0 0
0 0 0 0 0 0 0 0 Yg 0 0 0 0 0 Sg 0 0 0 0 0
0 0 0 0 0 0 0 0 0 Yt 0 0 0 0 0 St 0 0 0 0
0 Zx 0 0 0 0 0 0 0 0 0 0 0 0 0 0 X 0 0 0
0 0 Zt 0 0 0 0 0 0 0 0 0 0 0 0 0 0 T 0 0
0 0 0 Wc 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C 0
0 0 0 0 Wg 0 0 0 0 0 0 0 0 0 0 0 0 0 0 G
Multiplicando esta matriz pelas seguintes dire¸c˜oes:
dt = (d
r1 =ut−a−su
r2 =lt−a−t+sl
r3 =a−ATx
r4 =−ACx−sc+c
r5 =ug−AGx+g−sg
r6 =lt−t−st
r7 =yu−yl+ya
r8 =−AtTya+ACt yc+AtGyg−zx
r9 =wm1Te−yl+yt−zt
r10= m1Ce−yc−wc
r11= m1Ge−yg−wg
r12=µe−YuSuemT
r13=µe−YlSlemT
r14=µe−YcScemC
r15=µe−YgSgemG
r16=µe−YtStemT
r17=µe−XZxe
r18=µe−T ZtemT
r19=µe−CWcemC
r20=µe−GWgemG,
obtemos assim o sistema linear, Jd=r:
da+dsu =r1 (4.5)
da+dt−dsl =r2 (4.6)
−da+ATdx=r3 (4.7)
ACdx−dc+dsc =r4 (4.8)
AGdx−dg +dsg =r5 (4.9)
dt+dst =r6 (4.10)
−dyu+dyl −dya =r7 (4.11)
At
Tdya −A
t
Cdyc −A
t
Gdyg +dzx =r8 (4.12)
dyl−dyt +dzt =r9 (4.13)
dyc +dwc =r10 (4.14)
dyg +dwg =r11 (4.15)
Yudsu+Sudyu =r12 (4.16)
Yldsl+Sldyl =r13 (4.17)
Ycdsc+Scdyc =r14 (4.18)
Ygdsg +Sgdyg =r15 (4.19)
Ytdst +Stdyt =r16 (4.20)
Zxdx+Xdzx =r17 (4.21)
Ztdt+T dzt =r18 (4.22)
Wcdc+Cdwc =r19 (4.23)
Wgdg+Gdwg =r20. (4.24)
4.1.2
Elimina¸
c˜
ao de Vari´
aveis
As equa¸c˜oes de (4.5) a (4.24) definem o sistema linear que determina as dire¸c˜oes dos
m´etodos de pontos interiores. Este sistema pode ser resolvido diretamente mas esta
op¸c˜ao ´e muito cara computacionalmente devido `a sua grande dimens˜ao. No entanto, este
sistema pode ser reduzido atrav´es da substitui¸c˜ao de vari´aveis de forma similar `a redu¸c˜ao
Isolando as vari´aveis duais de (4.16) a (4.24), obtemos:
dyu =S−
1
u (r12−Yudsu)
dyl =S
−1
l (r13−Yldsl)
dyc =S−
1
c (r14−Ycdsc)
dyg =S−
1
g (r15−Ygdsg)
dyt =S
−1
t (r16−Ytdst)
dzx =X−
1(r
17−Zxdx) (4.25)
dzt =T−
1(r
18−Ztdt)
dwc =C−
1(r
19−Wcdc)
dwg =G−
1(r
20−Wgdg)
substituindo em (4.11) `a (4.15):
−S−1
u (r12−Yudsu) +S
−1
l (r13−Yldsl)−dya =r7 ⇒
S−1
u Yudsu−S
−1
l Yldsl−dya =r7+S−
1
u r12−Sl−1r13 =r21
At
Tdya−A
t
CSc−1(r14−Ycdsc)−A
t
GSg−1(r15−Ygdsg) +X−
1(r
17−Zxdx) =r8 ⇒
At
Tdya+A
t
CSc−1Ycdsc+A
t
GSg−1Ygdsg−X−
1Z
xdx =r8+AtCSc−1r14+AtGSg−1r15−X−1r17 =r22
S−1
l (r13−Yldsl)−S−
1
t (r16−Ytdst) +T−
1(r
18−Ztdt) = r9 ⇒ −S−1
l Yldsl+S
−1
t Ytdst −T−
1Z
tdt=r9−Sl−1r13+S−
1
t r16−T−1r18 =r23
S−1
c (r14−Ycdsc) +C−1(r19−Wcdc) =r10 ⇒ −S−1
c Ycdsc −C−
1W
cdc =r10−Sc−1r14−C−1r19=r24
S−1
g (r15−Ygdsg) +G−
1(r
20−Wgdg) = r11⇒ −S−1
g Ygdsg −G−
1W
gdg =r11−Sg−1r15−G−1r20 =r25.
abaixo:
S−1
u Yudsu−S
−1
l Yldsl−dya =r21 (4.26)
At
Tdya+A
t CS−
1
c Ycdsc+A
t GS−
1
g Ygdsg −X
−1Z
xdx =r22 (4.27)
−S−1
l Yldsl+S
−1
t Ytdst −T
−1Z
tdt=r23 (4.28)
−S−1
c Ycdsc−C
−1W
cdc =r24 (4.29)
−S−1
g Ygdsg −G
−1W
gdg =r25. (4.30)
Tomemos agora:
dsu =r1−da
dsl =−r2+da+dt
dsc =Y−
1
c Sc(−C−1Wcdc−r24) (4.31)
dsg =Y−
1
g Sg(−G−1Wgdg−r25)
dst =r6−dt
e substituindo as equa¸c˜oes acima em (4.8), (4.9) e (4.26) a (4.28) temos:
Acdx−dc+Yc−1Sc(−C−1Wcdc −r24) =r4 ⇒
Acdx−(I +Yc−1ScC−1Wc)dc =r4+Yc−1Scr24=r26
Agdx−dg+Yg−1Sg(−G−1Wgdg−r25) =r5 ⇒
Agdx−(I +Yg−1SgG−1Wg)dg =r5+Yg−1Sgr25 =r27
S−1
u Yu(r1−da)−Sl−1Yl(−r2+da+dt)−dya =r21⇒
−(S−1
u Yu+Sl−1Yl)da−Sl−1Yldt−dya =r21−S−
1
u Yur1−Sl−1Ylr2 =r28
At
Tdya+AtCSc−1Yc(Yc−1Sc(−C−1Wcdc−r24))+AGtSg−1Yg(Yg−1Sg(−G−1Wgdg−r25))−X−1Zxdx =
r22 ⇒AtTdya −A
t
CC−1Wcdc−AGt G−1Wgdg−X−1Zxdx =r22+AtCr24+AtGr25=r29
−S−1
l Yl(−r2+da+dt) +St−1Yt(r6−dt)−T−1Ztdt=r23⇒ −S−1
l Ylda−(S−
1
l Yl+S−
1
t Yt+T−1Zt)dt=r23−Sl−1Ylr2 −S−
1
Restando as seguintes equa¸c˜oes:
−da+ATdx =r3
Acdx−(I+Yc−1ScC−1Wc)dc =r26
Agdx−(I+Yg−1SgG−1Wg)dg =r27 −(S−1
u Yu+Sl−1Yl)da−Sl−1Yldt−dya =r28
At
Tdya−A
t
CC−1Wcdc−AtGG−1Wgdg−X−1Zxdx =r29 −S−1
l Ylda−(Sl−1Yl+St−1Yt+T−1Zt)dt=r30.
(4.32)
Definimos agora as seguintes matrizes diagonais para simplificar a nota¸c˜ao:
D1 =I+Yc−1ScC−1Wc
D2 =I+Yg−1SgG−1Wg
D3 =Su−1Yu+Sl−1Yl
D4 =Sl−1Yl (4.33)
D5 =C−1Wc
D6 =G−1Wg
D7 =X−1Zx
D8 =Sl−1Yl+S−
1
t Yt+T−1Zt.
Substituindo no sistema (4.32), temos:
−da+ATdx =r3 (4.34)
Acdx−D1dc =r26 (4.35)
Agdx−D2dg =r27 (4.36)
−D3da−D4dt−dya =r28 (4.37)
AtTdya−A
t
CD5dc−AtGD6dg−D7dx =r29 (4.38)
−D4da−D8dt =r30. (4.39)
Isolando dya e dt das equa¸c˜oes (4.37)e (4.39), teremos:
dya =−D3da−D4dt−r28 e (4.40)
Substitu´ımos na Equa¸c˜ao (4.38), obtemos:
At
T(−D3da−D4dt−r28)−AtCD5dc−AtGD6dg−D7dx =r29 ⇒ −At
TD3da−AtTD4dt−AtCD5dc−AtGD6dg−D7dx =r29+AtTr28 ⇒ −At
TD3da−AtTD4(−D−
1
8 (r30+D4da))−AtCD5dc −AtGD6dg−D7dx =r29+AtTr28⇒
−At
TD3da+AtTD4D8−1D4da−AtCD5dc−AGt D6dg−D7dx=r29+AtTr28−AtTD4D−81r30 −At
T(D3+D4D−
1
8 D4)da−AtCD5dc−AtGD6dg −D7dx =r31. (4.42)
Logo, temos o seguinte sistema linear:
ATdx−da =r3
ACdx−D1dc =r26
AGdx−D2dg =r27 −At
TDada−AtCD5dc −AtGD6dg−D7dx =r31,
onde,
Da = (D3−D4D8−1D4). (4.43)
Lembrando que: A = AT AC AG
e definindo d=
da dc dg
, D =
I 0 0
0 D1 0
0 0 D2
, rp =
r3 r26 r27 e ˜ D=
Da 0 0
0 D5 0
0 0 D6
.
Podemos reescrever o sistema da seguinte forma:
Adx−Dd=rp (4.44)
−D7dx−AtDd˜ =r31. (4.45)
Isolando d da equa¸c˜ao (4.44), temos:
d=D−1(Ad
x−rp). (4.46)
Admitindo-se que a matriz A tem mais linhas (que est˜ao representadas pelo n´umero de
em (4.45) temos:
−D7dx−ATDD˜ −1Adx+ATDD˜ −1rp =r31⇒
(D7+ATDD˜ −1A)dx =r31−ATDD˜ −1rp =−r˜p.
Logo,
(ATDD˜ −1A+D
7)dx= ˜rp. (4.47)
Este sistema ´e sim´etrico e definido positivo podendo ser resolvido pela decomposi¸c˜ao de
Cholesky. Sua dimens˜ao ´e muito menor que o sistema original representado pelas equa¸c˜oes
(4.5) a (4.24).
4.1.3
Resumo do M´
etodo de Pontos Interiores
O m´etodo de pontos interiores desenvolvido nesta se¸c˜ao pode ser resumido da seguinte
forma:
Seja, h= (t, c, g, x, su, sl, sc, sg, st) e j= (yu, yl, yc, yg, yt, zx, zt, wc, wg)
Dado um ponto interior (h0, j0)
Para k = 1,2,· · ·
Calcule as matrizes diagonais D1 `a D8 por (4.33) e Da por (4.43)
Calcule os res´ıduos:
r1 a r20 por (4.4)
r21 a r25 por (4.26) `a (4.30)
r26 a r30 por (4.35) `a (4.39)
r31 por (4.42)
rp por (4.44) e ˜rp por (4.47)
Calcule d por (4.47),
Calcule as dire¸c˜oes:
dya por (4.40), dt por (4.41),
dsu, dsl, dsc, dsg, dst por (4.31) e
dyu, dyc, dyg, dyt, dzx, dzt, dwc, dwg por (4.25) Calcule ρp por (2.1) e ρd por (2.2)
Calcule αp e αd por (2.3)
yk+1
a =yak+αddkya
hk+1
p =hk+αkpdkh
jdk+1 =jk+αk ddkj
at´e convergir.
4.1.4
M´
etodo Preditor-Corretor para An´
alise M´
edia
No m´etodo preditor-corretor dois sistemas lineares determinam as dire¸c˜oes.
Primeira-mente ´e calculada adire¸c˜ao afim (dh, dj, da, dya) resolvendo o sistema linear (4.5) a (4.24) com µ= 0. Em seguida, a dire¸c˜ao desejada ´e obtida resolvendo o seguinte sistema linear
[13]:
da+dsu =r1
da+dt−dsl =r2
−da+ATdx =r3
ACdx−dc+dsc =r4
AGdx−dg+dsg =r5
dt+dst =r6
−dyu+dyl −dya =r7
At
Tdya −A
t
Cdyc −A
t
Gdyg +dzx =r8
dyl−dyt +dzt =r9
dyc +dwc =r10
dyg +dwg =r11
Yudsu+Sudyu = ˜r12
Yldsl+Sldyl = ˜r13
Ycdsc +Scdyc = ˜r14
Ygdsg +Sgdyg = ˜r15
Ytdst +Stdyt = ˜r16
Zxdx+Xdzx = ˜r17
Ztdt+T dzt = ˜r18
Wcdc+Cdwc = ˜r19
onde os novos res´ıduos s˜ao dados por: ˜
r12 =µemT −YuSuemT −Dy˜uDs˜uemT ˜
r13 =µemT −YlSlemT −Dy˜lDs˜lemT ˜
r14 =µemC −YcScemC −Dy˜cDs˜cemC ˜
r15 =µemG−YgSgemG−Dy˜gDs˜gemG ˜
r16 =µemT −YtStemT −Dy˜tDs˜temT ˜
r17 =µe−ZxXe−Dz˜xDxe˜
˜
r18 =µemT −ZtT emT −Dz˜tD˜temT ˜
r19 =µemC −WcCemC −Dw˜cDce˜ mC ˜
r20 =µemG−WgGemG−Dw˜gDge˜ mG
e o parˆametro µ´e calculado da forma descrita no Cap´ıtulo 2.
4.2
An´
alise Absoluta
Trabalhamos agora com aan´alise absoluta(3.3), descrita no Cap´ıtulo 3. Com esta escolha
o problema (3.1) se reduz a:
min weT
mTt+e
T
mCc+e
T mGg
s.a lt−emTe
T
mTt≤ATx≤ut
ACx≤emC +emCe
T mCc
AGx≤emG+emGe
T mGg 0≤emTe
T
mTt≤lt
−emC ≤emCe
T mCc
emGe
T
mGg ≥0
x≥0.
Nosso pr´oximo objetivo consiste em obter um problema linear na forma padr˜ao contendo
equa¸c˜oes lineares, teremos ent˜ao:
min weT mTt+e
T
mCc+e
T mGg
s.a lt−emTe
T
mTt≤a≤ut
ATx=a
ACx≤emC +emCe
T mCc
AGx≤emG+emGe
T mGg 0≤eT
mTt≤λ
eT
mCc≥ −1
eT
mGg ≥0
x≥0.
Os vetores t, c e g n˜ao tem significado f´ısico e neste modelo s´o nos interessa a soma dos
seus elementos. Assim, criamos uma vari´avel para caracterizar a soma dos elementos de
cada um deles: eT
mTt =τ, e
T
mCc=γ, e
T
mGg =β, obtendo o seguinte problema:
min wτ+γ+β
s.a lt−emTτ ≤a≤ut
ATx=a
ACx≤emC +emCγ
AGx≤emG+emGβ 0≤τ ≤λ
γ ≥ −1
β ≥0
Tomando ˜γ =γ+ 1 para facilitar o desenvolvimento, e introduzindo as vari´aveis de folga
para obter as equa¸c˜oes de igualdade e temos:
min wτ + ˜γ−1 +β
s.a a+su =ut
a+emTτ−sl =lt
ATx−a= 0
ACx−emCγ˜+sc = 0
AGx−emGβ+sg =emG
τ+σt=λ
(x, su, sl, sc, sg, σt, τ, β,γ˜)≥0,
a:livre.
Retiramos o -1 da fun¸c˜ao objetivo e sem perda de generalidade substitu´ımos γ no lugar
de ˜γ obtemos o problema primal:
min wτ+γ+β
s.a a+su =ut
a+emTτ−sl =lt
ATx−a= 0
ACx−emCγ+sc = 0 (4.48)
AGx−emGβ+sg =emG
τ+σt=λ
(x, su, sl, sc, sg, σt, τ, β, γ)≥0,
Para encontrar o problema dual, escrevemos a matriz de restri¸c˜oes de (4.48): M =
I 0 0 0 0 I 0 0 0 0
I emT 0 0 0 0 −I 0 0 0
−I 0 0 0 AT 0 0 0 0 0
0 0 −emC 0 AC 0 0 I 0 0
0 0 0 −emG AG 0 0 0 I 0
0 1 0 0 0 0 0 0 0 1
.
Multiplicando a transposta de M, por y, o vetor de vari´aveis duais temos:
Mty=
I I −I 0 0 0
0 eT
mT 0 0 0 1
0 0 0 −eT
mC 0 0
0 0 0 0 −eT
mG 0
0 0 AT
T ATC ATG 0
I 0 0 0 0 0
0 −I 0 0 0 0
0 0 0 I 0 0
0 0 0 0 I 0
0 0 0 0 0 1
ou seja,
yu+yl−ya= 0
eT
mTyl+πt≤w
−eT
mCyc ≤1
−eT
mGyg ≤1
AT
Tya+ATCyc+ATGyg ≤0
yu ≤0
−yl ≤0
yc ≤0
yg ≤0
πt≤0.
Definindo, yu =−y˜u; yc =−y˜c; yg =−y˜g; πt=−π˜t
e substituindo no modelo anterior, obtemos:
−y˜u+yl−ya = 0
eT
mTyl−π˜t ≤w
eT
mCy˜c ≤1
eT
mGy˜g ≤1
AT
Tya−ATCy˜c−ATGy˜g ≤0
( ˜yu, yl,y˜c,y˜g,π˜t,≥0
Introduzimos agora as vari´aveis de folga z, ζt, ζc e ζg obtemos as restri¸c˜oes na forma de
igualdade:
−y˜u+yl−ya = 0
eT
mTyl−π˜t+ζt=w
eT
mCy˜c +ζc = 1
eT
mGy˜g +ζg = 1
AT
Tya−ATCy˜c−ATGy˜g+zx = 0
( ˜yu, yl,y˜c,y˜g,π˜t, ζt, ζcζgzx)≥0
ya :livre.
Sem perda de generalidade, tomamos ˜yu = yu; ˜yc = yc; ˜yg = yg; ˜πt = πt e, encontramos
finalmente o problema dual no formato desejado:
max −uT
tyu+lTtyl−eTmgyg −λπt
s.a −yu+yl−ya= 0
eT
mTyl−πt+ζt=w
eT
mCyc+ζc = 1 (4.49)
eT
mGyg+ζg = 1
AT
Tya−ATCyc−ATGyg+zx = 0
(yu, yl, yc, yg, πt, ζt, ζc, ζg, zx)≥0
ya:livre.
As condi¸c˜oes de complementaridade para os problemas (4.48) e (4.49) s˜ao dadas por:
YuSuemT = 0; YlSlemT = 0; YcScemC = 0
YgSgemG = 0; πtσt= 0; τ ζt= 0
γζc = 0; βζg = 0; XZxe= 0.
As condi¸c˜oes de otimalidade para os problemas (4.48) e (4.49) s˜ao dadas pela factibilidade primal:
a+su =ut
a+emTτ−sl =lt
ATx−a= 0
ACx−emCγ+sc = 0
AGx−emGβ+sg =emG
τ+σt=λ
(x, su, sl, sc, sg, σt, τ, β, γ)≥0,
a:livre,
factibilidade dual:
−yu+yl−ya = 0
eT
mTyl−πt+ζt =w
eT
mCyc+ζc = 1
eT
mGyg+ζg = 1
AT
Tya−ATCyc−ATGyg +zx = 0
(yu, yl, yc, yg, πt, ζt, ζc, ζg, zx)≥0
ya :livre,
e as condi¸c˜oes de complementaridade (4.50).
4.2.1
O M´
etodo Primal-Dual para An´
alise Absoluta
Seguindo os passos descritos no Cap´ıtulo 2, determinamos as dire¸c˜oes do m´etodo primal-dual, para os problemas (4.48) e (4.49) escrevendo primeiramente o Jacobiano:
J=
I 0 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 0
I 0 emT 0 0 0 −I 0 0 0 0 0 0 0 0 0 0 0 0 0
−I AT 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 AC 0 −emC 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 AG 0 0 −emG 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 −I −I I 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 eT
mt 0 0 −1 1 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 eT
mc 0 0 0 1 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 eTmg 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 ATT 0 0 −ATC −ATG 0 0 0 0 I
0 0 0 0 0 Yu 0 0 0 0 0 Su 0 0 0 0 0 0 0 0
0 0 0 0 0 0 Yl 0 0 0 0 0 Sl 0 0 0 0 0 0 0
0 0 0 0 0 0 0 Yc 0 0 0 0 0 Sc 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Yg 0 0 0 0 0 Sg 0 0 0 0 0
0 0 0 0 0 0 0 0 0 πt 0 0 0 0 0 σt 0 0 0 0
0 0 ζt 0 0 0 0 0 0 0 0 0 0 0 0 0 τ 0 0 0
0 0 0 ζc 0 0 0 0 0 0 0 0 0 0 0 0 0 γ 0 0 0 0 0 0 ζg 0 0 0 0 0 0 0 0 0 0 0 0 0 β 0
0 Zx 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 X
Obtemos agora os res´ıduos resultantes da aplica¸c˜ao do m´etodo de Newton `as condi¸c˜oes de otimalidade:
r1 =ut−a−su
r2 =lt−a−emTτ +sl
r3 =−ATx+a
r4 =−ACx+emCγ−sc
r5 =emG−AGx+emGβ−sg
r6 =λ−τ−σt
r7 =yu−yl+ya
r8 =w−eTmTyl+πt−ζt
r9 = 1−eTmCyc−ζc
r10= 1−eTmGyg −ζg
r11=−ATTya+ACTyc+ATGyg−zx
r12=−YuSuemT +µemT
r13=−YlSlemT +µemT
r14=−YcScemC +µemC
r15=−YgSgemG+µemG
r16=−πtσt+µ
r17=−τ ζt+µ
r18=−γζc +µ
r19=−βζg+µ
r20=−XZxe+µe.
(4.51)
Multiplicamos a matriz do Jacobiano pelas seguintes dire¸c˜oes:
dt = (d
aos res´ıduos r= (r1, r2, r3,· · ·, r20), temos, Jd=r:
da+dsu =r1 (4.52)
da+emTdτ −dsl =r2 (4.53)
−da+ATdx =r3 (4.54)
ACdx−emCdγ+dsc =r4 (4.55)
AGdx−emGdβ +dsg =r5 (4.56)
dτ +dσt =r6 (4.57)
−dya−dyu+dyl =r7 (4.58)
eT
mTdyl−dπt+dζt =r8 (4.59)
eT
mCdyc +dζc =r9 (4.60)
eT
mGdyg +dζg =r10 (4.61)
ATTdya −A
T
Cdyc−A
T
Gdyg +dzx =r11 (4.62)
Yudsu+Sudyu =r12 (4.63)
Yldsl+Sldyl =r13 (4.64)
Ycdsc +Scdyc =r14 (4.65)
Ygdsg +Sgdyg =r15 (4.66)
πtdσt +σtdπt =r16 (4.67)
ζtdτ+τ dζt =r17 (4.68)
ζcdγ+γdζc =r18 (4.69)
ζgdβ +βdζg =r19 (4.70)
Zxdx+Xdzx =r20. (4.71)
4.2.2
Elimina¸
c˜
ao de Vari´
aveis
As equa¸c˜oes de (4.52) a (4.71) definem o sistema linear que determina as dire¸c˜oes dos
m´etodos de pontos interiores para a an´alise m´edia. Este sistema pode ser resolvido
dire-tamente mas esta op¸c˜ao ´e muito cara computacionalmente devido `a sua grande dimens˜ao.
Isolando as vari´aveis duais de (4.63) a (4.71), obtemos:
dyu =S−
1
u (r12−Yudsu)
dyl =S
−1
l (r13−Yldsl)
dyc =S−
1
c (r14−Ycdsc)
dyg =S−
1
g (r15−Ygdsg)
dπt =σ
−1
t (r16−πtdσt) (4.72)
dζt =τ−
1(r
17−ζtdτ)
dζc =γ−
1(r
18−ζcdγ)
dζg =β−
1(r
19−ζgdβ)
dzx =X−
1(r
20−Zxdx)
substituindo (4.72) em (4.58) `a (4.62):
−dya−S−
1
u (r12−Yudsu) +Sl−1(r13−Yldsl) =r7 ⇒ −dya+S−
1
u Yudsu−S
−1
l Yldsl =r7+S
−1
u r12−Sl−1r13=r21
eT mTS
−1
l (r13−Yldsl)−σ
−1
t (r16−πtdσt) +τ−
1(r
17−ζtdτ) =r8 ⇒ −eT
mTS
−1
l Yldsl+σ
−1
t πtdσt −τ−
1ζ
tdτ =r8+σt−1r16−τ−1r17−eTmTS
−1
l r13=r22
eT mCS
−1
c (r14−Ycdsc) +γ−
1(r
18−ζcdγ) = r9 ⇒ −eT
mCS
−1
c Ycdsc−γ−
1ζ
cdγ =r9−eTmCS
−1
c r14−γ−1r18 =r23
eT mGS
−1
g (r15−Ygdsg) +β−
1(r
19−ζgdβ) = r10⇒ −eT
mGS
−1
g Ygdsg −β−
1ζ
gdβ =r10−eTmGS
−1
g r15−β−1r19=r24
At
Tdya−A
t
CSc−1(r14−Ycdsc)−A
t
GSg−1(r15−Ygdsg) +X−
1(r
20−Zxdx) =r11⇒
At
Tdya+AtCSc−1Ycdsc+A
t
GSg−1Ygdsg−X−
1Z
xdx =r11+AtCSc−1r14+AtGSg−1r15−X−1r20 =r25.