Planejamento do tratamento por radioterapia através de métodos de pontos interio...

(1)

Planejamento do Tratamento por Radioterapia

Atrav´

es de M´

etodos de Pontos Interiores

1

Cec´ılia Bollini Barboza Cid

Orientador: Prof. Dr. Aurelio Ribeiro Leite de Oliveira

Instituto de Ciências Matemáticas e de Computa¸cão

ICMC-USP - S˜ao Carlos

(2)

(3)

Agradecimentos

Quero manifestar minha gratid˜ao ao meu orientador Professor Dr. Aurelio Ribeiro

Leite de Oliveira pela amizade, cr´ıticas, sugest˜oes e apoio, os quais proporcionaram a

elabora¸c˜ao deste trabalho.

Meus agradecimentos `a minha fam´ılia, especialmente aos meus av´os, Pl´ınio e Izelda,

por todo seu amor, sabedoria, incentivo e ora¸c˜oes.

Um obrigado muito especial ao Alexandre que me apoiou em todo momento, com

muito amor, compreens˜ao e incentivo.

Tamb´em gostaria de agradecer a todos meus companheiros de mestrado que

con-tribu´ıram para realiza¸c˜ao deste trabalho e que se revelaram grandes amigos.

Quero manifestar meu reconhecimento e gratid˜ao a Deus, que sempre me mostrou

o caminho a ser seguido, nunca deixou que eu me esquecesse do quanto a vida ´e realmente

bela, e que é verdadeiramente o responsável pela realiza¸cão deste trabalho.

Finalmente, gostaria de agradecer ao apoio financeiro do CNPq e a todos que de

(4)

Resumo

O objetivo deste trabalho consiste no desenvolvimento, estudo e implementa¸c˜ao de m´etodos

de pontos interiores espec´ıficos para o problema de planejamento do tratamento de cˆancer

por radioterapia. Este ´e um problema de grande porte que cont´em uma estrutura

matri-cial particular. A explora¸c˜ao desta estrutura de forma eficiente obt´em bom desempenho

computacional, através da redu¸cão da dimensão dos sistemas lineares que devem ser

re-solvidos a cada itera¸c˜ao, agilizando a defini¸c˜ao de um tratamento adequado, uma vez que

tipicamente várias simula¸cões são realizadas antes da defini¸cão de um plano definitivo.

Resultados num´ericos em Matlab ilustram a eficiˆencia desta abordagem em problemas

reais e mostram a superioridade do método preditor corretor em compara¸cão ao método

(5)

(6)

Abstract

In this work, a specialized interior point method is developed for planning cancer

treat-ment by radiotherapy. This is a large-scale problem with a specific matrix structure. That

structure is explored in an efficient way reducing the dimension of the linear system which

must be solved at each iteration speeding up the treatment design since usually several

versions must be solved to obtain a satisfactory plan. Moreover, the system obtained is

sparse, symmetric and positive definite. Numerical results in Matlab illustrate the

effi-ciency of this approach in real problems and show the superiority of the preditor-corrector

(7)

(8)

Conte´

udo

1 Introdu¸c˜ao 1

1.1 Abordagem por M´etodos de Pontos Interiores . . . 1

2 Métodos de Pontos Interiores para Programa¸cão Linear 3 2.1 Método de Newton para uma Variável . . . 4

2.2 Método de Newton para Várias Variáveis . . . 5

2.3 M´etodo Primal-Dual Afim Escala . . . 5

2.3.1 M´etodo Primal-Dual Cl´assico . . . 7

2.4 M´etodo Preditor-Corretor . . . 8

2.5 Cálculo das Dire¸cões nos Métodos de Pontos Interiores . . . 10

3 Um Modelo para Formula¸c˜ao do Tratamento por Radioterapia 13 3.1 Formula¸c˜ao do Modelo . . . 16

3.2 Problema de Otimiza¸c˜ao Linear . . . 18

3.3 Propriedades das Restri¸c˜oes El´asticas . . . 20

3.3.1 Interpreta¸c˜ao das Solu¸c˜oes . . . 20

4 Métodos de Pontos Interiores Aplicados ao Modelo de Tratamento por Radioterapia 23 4.1 Análise Média . . . 23

4.1.1 O Método Primal-Dual para Análise Média . . . 28

4.1.2 Elimina¸c˜ao de Vari´aveis . . . 30

4.1.3 Resumo do M´etodo de Pontos Interiores . . . 35

4.1.4 Método Preditor-Corretor para Análise Média . . . 36

(9)

4.2.1 O M´etodo Primal-Dual para An´alise Absoluta . . . 43

4.2.2 Elimina¸c˜ao de Vari´aveis . . . 45

4.2.3 Resumo do M´etodo de Pontos Interiores . . . 52

4.2.4 M´etodo Preditor-Corretor para An´alise Absoluta . . . 53

5 Resultados Computacionais 55 6 Conclus˜oes 59 6.1 Perspectivas Futuras . . . 59

(10)

Cap´ıtulo 1

Introdu¸

c˜

ao

Modelos de programa¸c˜ao linear tem sido usados extensivamente para encontrar bons

planos de tratamento por radioterapia. A primeira formula¸c˜ao proposta como um modelo

de programa¸cão linear ocorreu em 1968 [3]. O objetivo do tratamento é eliminar as células

do tumor através de radia¸cão ao mesmo tempo em que procura evitar a destrui¸cão de

células vizinhas saudáveis também afetadas pela radia¸cão. Existem atualmente máquinas

sofisticadas inspiradas na tomografia computadorizada que emitem radia¸c˜ao ao longo de

todo o corpo do paciente [23], por um lado ampliando as possibilidades de minimiza¸c˜ao

destes efeitos colaterais e por outro aumentando a complexidade de obten¸c˜ao de planos

de tratamento.

Do ponto de vista matem´atico, o desafio consiste em emitir uma alta dosagem

de radia¸c˜ao no tumor, suficiente para sua elimina¸c˜ao, e simultaneamente, minimizar a

radia¸cão nas regiões vizinhas compostas de tecido saudável, reduzindo ao máximo as

complica¸cões nestas regiões que são muitas vezes cr´ıticas.

1.1 Abordagem por M´

etodos de Pontos Interiores

Uma vantagem deste problema, do ponto de vista computacional, ´e que ele pode ser

mo-delado como um problema de otimiza¸c˜ao linear [3, 8, 9, 22, 24, 23]. Por outro lado, o tipo

de solu¸cão obtida pelo método simplex para estes modelos não corresponde ao tratamento

mais adequado do ponto de vista médico porque as variáveis não básicas estarão nos seus

(11)

m´ınima estabelecida para sua elimina¸c˜ao enquanto parte do tecido saud´avel pode receber

a dosagem m´axima permitida.

Solu¸cões deste tipo são naturalmente evitadas pelos métodos de pontos interiores.

Na presen¸ca de múltiplas solu¸cões esses métodos convergem para aquelas, em certa

me-dida, distanciadas de vértices. Estas seriam as solu¸cões mais adequadas na formula¸cão

de um tratamento, pois as vari´aveis n˜ao tendem a atingir seus limites na presen¸ca de

múltiplas solu¸cões. Uma outra vantagem da abordagem por pontos interiores é a

possi-bilidade de trabalhar com pontos infact´ıveis durante o processo de otimiza¸c˜ao, facilitando

a identifica¸c˜ao de modelos mal formulados.

Uma motiva¸c˜ao adicional para a abordagem por m´etodos de pontos interiores,

est´a na estrutura matricial bem definida deste problema. Experiˆencias anteriores com o

desenvolvimento de m´etodos de pontos interiores espec´ıficos para uma classe de

proble-mas e a explora¸c˜ao da estrutura matricial dos sisteproble-mas lineares resultantes mostra que

esta abordagem ´e muito bem sucedida em termos da obten¸c˜ao de melhor desempenho

computacional [4, 15, 16, 18, 17, 19, 20, 21].

Este trabalho est´a organizado da seguinte forma: no Capitulo 2 s˜ao discutidos

os m´etodos de pontos interiores para programa¸c˜ao linear. No Capitulo 3 apresentamos

modelos para a formula¸c˜ao do tratamento por radioterapia e discutimos com mais detalhes

o modelo adotado. No Cap´ıtulo 4 os m´etodos de pontos interiores s˜ao aplicados ao

modelo de tratamento por radioterapia. No Capitulo 5 s˜ao apresentados os resultados

computacionais obtidos. Finalmente, no Capitulo 6 s˜ao apresentadas as conclus˜oes e

(12)

Cap´ıtulo 2

M´

etodos de Pontos Interiores para

Programa¸

c˜

ao Linear

Neste cap´ıtulo vamos adotar a seguinte forma, denominada padr˜ao, para o problema de

programa¸c˜ao linear:

min cT_x

s.a Ax=b

x≥0,

onde, A∈ ℜm×n _{com posto m e os vetores coluna x, c e b tem a dimens˜ao apropriada.}

O dual desse problema ´e dado por:

max bT_y

s.a AT_y₊_z ₌_c

z≥0.

Um ponto é dito interior quando todas as variáveis estão estritamente dentro de

seus limites [27] no problema dual por exemplo z0 _> _{0 ´e um ponto interior. Um ponto}

interior é fact´ıvel quando todas as restri¸cões são satisfeitas, ou seja, o ponto x0_{, onde,}

Ax0 ₌ _b _com _x0 _> _{0 ´e um ponto interior fact´ıvel. As condi¸c˜oes de otimalidade para}

(13)

factibilidade primal

b−Ax = 0

x≥0,

factibilidade dual

c−AT_y₋_z _{= 0}

z ≥0,

e condi¸c˜oes de complementaridade [26]

xizi = 0, i= 1· · ·n

ou seja, XZe = 0,

onde, X ´e a matriz diagonal formada pelos elementos do vetor x, Z ´e a matriz diagonal

formada pelos elementos do vetorzeeé o vetor unitário,eT _{= (1}_,₁_,₁_,_{· · ·}_,₁₎_._{Os métodos}

de pontos interiores primais-duais podem ser desenvolvidos através aplica¸cão do método

de Newton `as condi¸c˜oes de otimalidade [27] partindo de um ponto interior desconsiderando

as desigualdades. A não negatividade das variáveis é controlada pelo tamanho do passo.

2.1 M´

etodo de Newton para uma Vari´

avel

Antes de desenvolvermos estes métodos, apresentaremos uma breve revisão do método de

Newton. O método de Newton para uma variável busca zeros de uma fun¸cão resolvendo

equa¸cões da forma,φ(x) = 0. Este método pode ser deduzido aplicando a série de Taylor

a φ(x) em torno de x0, obtendo:

φ(x) = φ(x0_{) +}_φ′₍_x0₎₍_x₋_x0_{) +}_{· · ·}

Ignorando os termos de ordem superior temos, para φ(x) = 0 com φ′₍_x₎₆_{= 0 :}

−_φφ′(₍xx00)₎ =x−x0 ⇒x=−

φ(x0₎

φ′₍x0₎ +x0

obtendo assim o processo iterativo:

xk+1 ₌_xk₋ φ(xk₎

φ′₍xk₎, onde d

k ₌₋φ(xk₎

φ′₍xk₎ ´e a dire¸c˜ao de Newton.

(14)

2.2 M´

etodo de Newton para V´

arias Vari´

aveis

O método de Newton para várias variáveis tem como objetivo encontrar os zeros de

sistemas de equa¸c˜oes da seguinte forma:

seja, f(x)=0, um conjunto de fun¸c˜oes n˜ao lineares φi(x) onde φi(x) = 0, i= 1,· · · , n.

O m´etodo pode ser deduzido aplicando a s´erie de Taylor para cada φi(x) em torno de x0,

obtendo:

φi(x) =φi(x0) + [∇φi(x0)]T(x−x0) +· · ·, para todo,i= 1· · ·n, onde

∇φi(x0) =



   

∂φi(x0)

∂x1

...

∂φi(x0)

∂xn



   

Ignorando os termos de ordem superior temos:

[∇φi(x0)]T(x−x0) =−φi(x0), i= 1,· · · , n.

Onde definimos agora o Jacobiano no ponto x0_:

J(x0) =



   

∇φ1(x0)

...

∇φn(x0)



   

T

e f(x0) =



   

φ1(x0)

...

φn(x0)



   

Podemos resumir assim o m´etodo de Newton:

Dado um ponto inicial x0

Para k = 0,1,· · ·

C´alculo da dire¸c˜ao dk₌₋_J₍_xk₎−1_f₍_xk₎

C´alculo do novo ponto xk+1 ₌_xk₊_dk

at´e convergir

onde um crit´erio de convergˆencia poderia ser kf(xk+1₎_k_/_k_xk+1_k _{menor que uma dada}

tolerˆancia.

2.3 M´

etodo Primal-Dual Afim Escala

Este método busca a solu¸cão dos problemas de programa¸cão linear primal e dual aplicando

variantes do método de Newton às condi¸cões de otimalidade, e modificando o tamanho

(15)

da seguinte forma,

f(x, y, z) =



   

Ax−b AT_y₊_z₋_c

XZe     

= 0.

Aplicando o método de Newton a este sistema de equa¸cões não lineares obtemos:

(x, y, z) = (x0_{, y}0_{, z}0₎₋₍_J₍_x0_{, y}0_{, z}0₎₎−1_f₍_x0_{, y}0_{, z}0_{) = (}_x0_{, y}0_{, z}0₎₋_d0_.

onde,

−f(x0, y0, z0) =−



   

Ax0₋_b

AT_y0₊_z0₋_c

X0_Z0_e

     =      r0 p r0 d r0 a     

≡r0.

A dire¸cão do método de Newton aplicado às equa¸cões f(x,y,z) torna-se:

J(x0, y0, z0)d0 =



   

A 0 0

0 AT _I

Z0 ₀ _X0

          d0 x d0 y d0 z      =      r0 p r0 d r0 a      logo,

d0 =

     d0 x d0 y d0 z      =     

A 0 0

0 AT _I

Z0 ₀ _X0



   

−1     r0 p r0 d r0 a      .

Podemos assim resumir o m´etodo de pontos interiores primal-dual afim escala:

dado um ponto interior (x0_{, y}0_{, z}0_{) onde (}_x0_{, z}0₎_>₀

Para k = 0,1,· · ·

rk

p =b−Axk

rk

d =c−ATyk−zk

rk

a =−XkZke

dk ₌_J−1₍_xk_{, y}k_{, z}k₎_rk

calcule o tamanho do passo primal αk

p e dual αkd

xk+1 ₌_xk₊_αk pdkx

yk+1 ₌_yk₊_αk ddky

(16)

at´e convergir.

O critério de convergência usado neste método é baseado nas condi¸cões de otimalidade:

xtz

1+ct_x₊_bt_y

≤ǫ

kb−Axk

1 +kbk ≤ǫ, kc−At_y₋_z_k

1 +kck ≤ǫ,

onde ǫ é a tolerância desejada e xt_z _{uma medida da condi¸cão de complementaridade.}

O tamanho do passo αk

p, αkd ´e calculado da seguinte forma:

primeiramente calculamos:

ρkp = min dxk

i<0

− x

k i

dxk i

, (2.1)

e em seguida,

ρk

d= min dzk

i<0

− z

k i

dzk i

. (2.2)

Os valores ρk

p e ρkd representam o tamanho de passo m´aximo tal que a primeira vari´avel

de x e z se anulam respectivamente.

Portanto, o tamanho do passo ser´a obtido multiplicando ρ por um parˆametro τ ∈

(0,1):

 

 αk

p =min(1, τ ρkp) e

αk

d =min(1, τ ρkd)

(2.3)

o que garante que nenhuma vari´avel de x ou z se anule. Adicionalmente, o passo ´e limitado

ao tamanho m´aximo 1, que corresponde a um passo de newton.

2.3.1 M´

etodo Primal-Dual Cl´

assico

O método afim-escala têm uma desvantagem importante: ele permite que as variáveis

(x,z) se aproximem de seus limites muito rapidamente. Conseq¨uentemente as dire¸c˜oes

calculadas s˜ao muito distorcidas e o m´etodo converge lentamente, pois xizi ≈ 0. Para

evitar que isto ocorra é acrescentada uma perturba¸cão (µ) na condi¸cão de

(17)

resolve o seguinte sistema de equa¸cões não lineares a cada itera¸cão:

    

   

b−Axk _{= 0}

c−At_yk₋_zk _{= 0}

µk_e₋_Xk_Zk_e_{= 0}_,

onde µk _{é um parâmetro que varia a cada itera¸cão} _µk _→ _{0 quando} _k _{→ ∞}_{. As ´}_unicas

altera¸cões do método primal-dual clássico em rela¸cão ao método afim-escala são a

substi-tui¸c˜ao de rk

a por rkc =µke−XkZke e o c´alculo da pertuba¸c˜aoµk =σk γ

k

n, onde γ

k ₌_xt_z_,

σ ∈(0,1), o valor γ_nk seria uma “medida” da distância média de um ponto a uma solu¸cão ótima. É importante ressaltar que o Jacobiano permanece o mesmo o que significa que

ambos m´etodos necessitam resolver sistemas lineares com a mesma matriz.

2.4 M´

etodo Preditor-Corretor

O método preditor-corretor [13] é o método de pontos interiores mais utilizado na prática,

pois obtém os melhores resultados computacionais e tem convergência quadrática

con-siderando a resolu¸cão de dois sistemas lineares em uma única itera¸cão.

Este método calcula uma dire¸cão com três componentes [27]:

• dire¸c˜ao afim-escala,

• dire¸c˜ao de centragem (σ),

• dire¸cão de corre¸cão que compensa a aproxima¸cão linear do método de Newton, que pode ser visualizada pela rela¸cão (x+dx)t(z+dz) = dtxdz.

No m´etodo preditor corretor calcula-se primeiro a dire¸c˜ao afim escala( ˜d= ˜dx,d˜y,d˜z):



   

   

Ad˜x =rp

At_d˜

y+ ˜dz =rd

Zd˜x+Xd˜z =ra =−XZe

(2.4)

Usando o mesmo Jacobiano encontra-se em seguida a dire¸c˜ao perturbada no ponto,

(18)

ou seja:

    

   

Adˆx =rp =b−Ax˜=b−A(x+ ˜dx) = 0

At_dˆ

y+ ˆdz =z−ATy˜−z˜= 0

Zdˆx+Xdˆz =µe−(X+ ˜Dx)(Z+ ˜Dz)e =µe−D˜xD˜ze

onde, µeé a dire¸cão de centragem e (X+ ˜Dx)(Z+ ˜Dz) representa a corre¸cão não linear.

A dire¸cão utilizada será a soma das duas dire¸cões:

dx = ˜dx+ ˆdx,

dy = ˜dy+ ˆdy,

dz = ˜dz+ ˆdz.

Logo, (dx, dy, dz), podem ser calculados diretamente somando o dois sistemas lineares:

    

   

Adx =rp

At_d

y+dz =rd

Zdx+Xdz =ra+µe−D˜xD˜ze=rs.

(2.5)

ou seja, não é necessário que ˆd= ( ˆdx,dˆy,dˆz) seja calculada.

O cálculo da perturba¸cão µk _{é fun¸cão da dire¸cão afim [13]. Quanto melhor a dire¸cão}

menor ser´a a perturba¸c˜ao e vice-versa: considere,

µk ₌_σk γk

n; ˜γ

k _{= (}_xk_{+ ˜}_αk

pdkx˜)t(zk+ ˜αkddk˜z)

onde, ˜αk

p e ˜αkd s˜ao o tamanho do passo em rela¸c˜ao ao problema primal e dual,

respectiva-mente para a dire¸c˜ao afim, calculados da seguinte forma:

˜

ρkp = min dxk

i<0

− x˜i

k

dx˜ik

e ρ˜kd= min dzk

i<0

− z˜i

k

dz˜ik

, sendo α˜kp = min(1, τρ˜ k

p) e α˜ k

d = min(1, τρ˜ k d),

com τ ∈(0,1). E,

σk =

 



(γ_γ˜kk)3, se γk>1

γk

√

n, caso contr´ario.

(2.6)

A idéia desse método é calcular a dire¸cão afim-escala e estudar o progresso do método ao

longo dessa dire¸c˜ao, calculando a perturba¸c˜aoµk _{de acordo com este progresso. Uma vez}

que uma segunda dire¸cão é calculada, também calcula-se a corre¸cão não linear utilizando

o mesmo Jacobiano da dire¸c˜ao anterior [13]. Por outro lado, se γk _< _{1 existem raz˜oes}

te´oricas para calcular uma perturba¸c˜ao proporcional a (γk₎2 _{[25], explicando assim a}

(19)

Podemos resumir o m´etodo preditor-corretor da seguinte forma:

Dados τ ∈(0,1),(x0_{, y}0_{, z}0_{) tal que (}_x0_{, z}0₎_>₀

para k = 0,1,· · ·

rk

p =b−Axk

rk

d =c−ATyk−zk

rk

a =−XkZke

Calcule ˜dk _{usando (2.4)}

Calcule ˜αk p,α˜kd

˜

γk _{= (}_xk_{+ ˜}_αk

pdkx˜)t(zk+ ˜αkddkz˜)

Calcule µk _{usando (2.6)}

rk

s =µke+rka−D˜xkD_z_˜ke Calcule dk _{usando (2.5)}

Calcule αk p, αkd

xk+1 ₌_xk₊_αk pdkx

yk+1 ₌_yk₊_αk ddky

zk+1 ₌_zk₊_αk ddkz

at´e convergir.

O critério de convergência é o mesmo dos métodos primais-duais.

2.5 C´

alculo das Dire¸

c˜

oes nos M´

etodos de Pontos

In-teriores

O sistema linear (2.5) tem dimensão 2n+m. Este sistema pode ser reduzido à dimensão

m atrav´es das seguintes rela¸c˜oes:

dy = (AD−1AT)−1(rp+AD−1rd−AZ−1rs)

dx =D−1(ATdy−rd+X−1rs)

dz =X−1(rs−Zdx),

obtidas eliminando-se dz e dx sucessivamente onde D=X−1Z.

Essas simplifica¸cões também são válidas para os métodos primal-dual afim escala

e clássico. A única altera¸cão será do res´ıduo rs que representa os valores ra erc,

(20)

onde uma matriz sim´etrica definida positiva (AD−1_AT_{) deve ser decomposta a cada}

ite-ra¸cão. Usualmente é utilizada a decomposi¸cão de Cholesky [7] na resolu¸cão deste sistema

(21)

(22)

Cap´ıtulo 3

Um Modelo para Formula¸

c˜

ao do

Tratamento por Radioterapia

Neste cap´ıtulo s˜ao apresentados alguns modelos de programa¸c˜ao linear para o tratamento

por radioterapia.

O primeiro passo no desenvolvimento de um plano de tratamento ´e definir a

lo-caliza¸c˜ao do tumor e da regi˜ao de risco (estrutura cr´ıtica). Em seguida, a dose do raio

é calculada individualmente conforme cada paciente. Uma formula¸cão para programa¸cão

linear consiste em minimizar a dose total emitida sujeito a um limite inferior da dose na

regi˜ao do tumor. Este modelo pode ser representado pela seguinte formula¸c˜ao:

min f =Pm

i=1

Pm

j=1Dij

s. a Dij =Pn_p₌₁ωpApij ∀(i, j)

l≤Dij ∀(i, j)∈Γ

w≥0,

onde,

Dij representa a dosagem total recebida pelo paciente na posi¸c˜ao (i, j);

Aij representa a dosagem nominal emitida pelo raio p na posi¸c˜ao (i, j);

w representa a pondera¸c˜ao da dosagem emitida pelos raios;

l representa a dosagem m´ınima a ser recebida pelo tumor;

Γ representa o subconjunto de posi¸c˜oes onde se encontra o tumor;

(23)

Figura 3.1: Uma representa¸c˜ao de aparelho de tratamento para radioterapia

m representa o n´umero total de pixels.

Definindo os seguintes subconjuntos:

• R representa o subconjunto de posi¸c˜oes onde se encontra tecido cr´ıtico (saud´avel) ou estrutura cr´ıtica;

• N representa o subconjunto de posi¸cões onde se encontram os demais tecidos saudáveis; é poss´ıvel formular um modelo com pondera¸cões em cada região do paciente privilegiando

ou penalizando algumas ´areas quanto `a quantidade de dosagem a ser recebida.

Em [23] s˜ao apresentados outros modelos de otimiza¸c˜ao linear que consistem em

pequenas varia¸c˜oes do modelo acima, tendo em mente o aparelho mostrado na Figura 3.1.

Suponha uma matriz de pixels de imagem n×n, e que os ˆangulos avaliados s˜ao

θ1, θ2, θ3,· · · , θρ. Além disso, supomos que cada ângulo está composto porηsub-raios. Os

sistemas de tratamento modernos s˜ao capazes de realizar combina¸c˜oes complexas entre

estes sub-raios. A geometria de um modelo usando raios elementares, onde n=2, ρ= 4 e

η = 4, é indicada na Figura 3.2. Os intervalos entre os ângulos é π

4, e o ˆangulo inicial ´e

(usualmente) zero.

Seja x(a,i) a dose ao longo do i-ésimo sub-raio doa-ésimo ângulo (a = 1, 2, . . . , p)

e d(p,a,i) a distˆancia entre o sub-raio x(a,i) e a imagem do pixel p. Definimos A(p,a,i) como

o produto de e−µd₍p,a,i) e a ´area geom´etrica comum a ambos os sub-raios x

(a,i) e o pixel p.

Por exemplo, na Figura 3.2 o raio hachurado correspondente a x(1,2) atinge a metade do

pixel 3 e a distˆancia deste pixel a este raio elementar ´e 3√2

2 (supondo que cada pixel tenha

a mesma largura igual a 1). Conseq¨uentemente, A(3,1,2) = 1₂e−

3√2

(24)

1 2 3 4 x x x x x x x x x x x x x x (2,4) (2,3) (2,2) (2,1) (1,4) (1,3) (1,2) x_(1,1) (4,4) (4,3) (4,1) x (3,4) (3,3) (3,2) (3,1) (4,2)

Figura 3.2: Geometria de uma imagem depixel 2×2 com ˆangulosπ

4, 3π 4 , 5π 4 e 7π 4 .

matriz de propaga¸cão dos raios, denotada por A, são A(p,a,i), onde as linhas de A são

indexadas por p e as colunas s˜ao indexadas por (a,i). O fator e−µd(p,a,i) _{mede atenua¸c˜ao}

da radia¸c˜ao sobre o tecido, e os valores deste coeficiente de atenua¸c˜ao, (µ), dependem

da energia do raio. O coeficiente de atenua¸c˜ao define a caracter´ıstica do tecido, ou seja,

com rela¸c˜ao a sua densidade. Podemos tomar como exemplo o Raio-X: quanto menor a

densidade do tecido menor o coeficiente de atenua¸c˜ao, portanto queimar´a mais o filme e

conseq¨uentemente este ficar´a mais escuro; quanto maior a densidade do tecido maior o

coeficiente de atenua¸c˜ao, portanto queimar´a menos o filme ficando mais claro.

A matriz dose de propaga¸cão sem atenua¸cão (µ=0) do exemplo da Figura 3.2, é

dada por:        

0 0 1

2 1 2 0 1 2 1 2 0 1 2 1

2 0 0 0

1 2

1 2 0

0 1₂ 1₂ 0 1₂ 1₂ 0 0 0 1₂ 1₂ 0 0 0 1₂ 1₂

0 1

2 1

2 0 0 0

1 2 1 2 0 1 2 1 2 0 1 2 1

2 0 0 1

2 1

2 0 0 0

1 2

1

2 0 0 0

1 2 1 2 0 1 2 1 2 0         .

Os elementos de x podem ser ordenados da seguinte forma:

[x(1,1) x(1,2) · · · x(1,r) x(2,1) · · · x(2,r) · · · x(ρ,1) · · · x(ρ,r)], assim a dose de radia¸c˜ao no

pixel p´e o p-´esimo componente de Ax.

Embora a matriz de propaga¸c˜ao da dose permita modelar facilmente os limites

superior e inferior da radia¸c˜ao para algum pixel na imagem, elaborar um plano de

(25)

que o tumor n˜ao receba menos do que 80 Gy, onde Gy ´e a dose absorvida, usualmente

medida em joules por quilograma (J/kg), tamb´em denominada gray (Gy): 1Gy = 1 J/kg.

Por outro lado, o plano de tratamento pode n˜ao permitir que alguma estrutura cr´ıtica

receba mais do que 40 Gy.

A maioria das pesquisas tem utilizado modelos de otimiza¸c˜ao com restri¸c˜oes

linea-res, com uma das duas fun¸c˜oes objetivos mais evidente, maximiza¸c˜ao da dose no tumor ou

minimiza¸c˜ao da dose na estrutura cr´ıtica. Uma vez que esta maximiza¸c˜ao leva geralmente

a altas doses, outros trabalhos buscam maximizar a dose m´ınima do tumor ou minimizar

a dose m´axima da estrutura cr´ıtica [10].

As metas listadas abaixo indicam que este problema tem uma grande quantidade

de parâmetros a considerar na decisão do que seria desejável para um plano de tratamento:

• Transmitir uma dose uniformemente letal na regi˜ao do tumor.

• Transmitir uma radia¸c˜ao t˜ao pequena quanto poss´ıvel na estrutura cr´ıtica.

• Obter uma dose total t˜ao pequena quanto poss´ıvel.

• Reduzir a freqüência de doses altas fora da região do tumor.

• Controlar o n´umero de raios utilizados no plano de tratamento.

O objetivo mais comum adotado na pr´atica consiste em transmitir a maior radia¸c˜ao

poss´ıvel no tumor [23]. H´a duas raz˜oes para evitar este objetivo. Normalmente altos

n´ıveis de radia¸c˜ao podem conduzir uma grande soma de necrose, e o corpo humano tem

dificuldade na elimina¸cão de um grande volume de tecido morto. Além disso, células

doentes estão distribu´ıdas entre tecidos saudáveis. Conseqüentemente, uma dose letal

uniformemente distribu´ıda na regi˜ao do tumor ´e crucial para o sucesso do plano de

trata-mento, pois, uma dose inferior permite que a c´elula cancerosa sobreviva enquanto uma

dose superior pode ter efeitos altamente indesej´aveis nos tecidos vizinhos.

3.1 Formula¸

c˜

ao do Modelo

Suponha que cada órgão do corpo humano está dividido por pixels, onde cada pixel

(26)

número de pixels do tumor,mC o número de pixels da estrutura cr´ıtica emG o número de

pixels restantes (tecido saud´avel), ou seja, m=mG+mT+mC. Finalmente n, representa

o número de sub-raios para atingir o alvo. A prescri¸cão é definida por quatro limites:

•

u

_t_{: representa o vetor de limite superior para radia¸c˜ao no tumor (}_u_t_{∈ ℜ}mT_);

•

l

_t_{: representa o vetor de limite inferior para radia¸c˜ao no tumor (}_l_t_{∈ ℜ}mT_);

•

u

_c_{: representa o vetor de limite superior para radia¸c˜ao na estrutura cr´ıtica (}_u_c _∈ ℜmC_);

•

u

_g_{: representa o vetor de limite superior para radia¸c˜ao no restante de tecido saud´avel}

(ug ∈ ℜmG).

Fazemos as suposi¸c˜oes ´obvias que 0 < lt ≤ ut, uc ≥ 0, e ug ≥ 0. Se uma dose letal

uniforme ´e transmitida ao tumor, o limite superior e inferior para os pixels do tumor

s˜ao obtidos atrav´es das metas estabelecidas. Supondo que as metas estabelecidas para

uma célula cancerosa sejam tg, os valores de uti e lti são geralmente (1 +ǫ)tg e (1−ǫ)tg, respectivamente, onde, ǫ é a porcentagem da varia¸cão para a dosagem do tumor e é

denominadon´ıvel de uniformidade do tumor. Valores t´ıpicos deǫencontrados na literatura

vão de 0.02 à 0.15 [8]. O vetor ug representa a maior quantidade de radia¸cão permitida

para algum pixel (saudável). Em geral tecidos saudáveis não devem receber mais do que

10% da dose estabelecida para o tumor. Ou seja, ug =tg(1 + 0.10).

As linhas da matriz de propaga¸c˜ao da dose podem ser reordenadas considerando

as linhas que correspondem ao tumor, as linhas que correspondem `a estrutura cr´ıtica, e

as linhas que correspondem ao tecido saudável. Esta reordena¸cão é representada pelas

sub-matrizes AT, AC eAG, como indicado abaixo:

A=



   

AT

AC

AG



   

ou seja, AT : tumor, AC : estrutura cr´ıtica e AG : restante de tecido saud´avel.

Sub-raios que não atingem o tumor são removidos pela elimina¸cão das colunas de

A que tem o vetor zero na coluna correspondente da submatrizAT. Assim, sem perda de

generalidade, consideraremos que a matriz AT n˜ao tem colunas nulas. Portanto, temos

que A∈ ℜm×n_{, A}

(27)

3.2 Problema de Otimiza¸

c˜

ao Linear

Um novo modelo de programa¸c˜ao linear usado para auxiliar no plano de radioterapia foi

introduzido em [8]. Este modelo incorpora restri¸c˜oes el´asticas, e quando resolvidas pelo

método de pontos interiores, produzem planos favoráveis. A fun¸cão objetivo é

represen-tada pela soma ponderada de trˆes metas: lT_t_{, que mede o quanto falta para que o plano}

encontrado consiga aplicar a dose m´ınima na regi˜ao do tumor;uT

ccque mede a quantidade

de radia¸c˜ao acima da prescrita recebida pela regi˜ao cr´ıtica; e uT

gg que mede a quantidade

de radia¸c˜ao acima da prescrita nos demais tecidos saud´aveis. O escalar positivo w

pon-dera a importância da formula¸cão de um plano que obtenha a dose m´ınima na região do

tumor, isto ´e, valores grandes de w for¸cam lT_t _{a ser t˜ao pequeno quanto poss´ıvel. Seria}

desej´avel que existisse valor para um finito w > 0 tal que o valor ´otimo da componente

lT_t_{fosse zero o que garantiria ao tumor receba o n´ıvel m´ınimo de radia¸c˜ao necess´ario para}

sua elimina¸c˜ao. O modelo proposto pode ser representado pela seguinte formula¸c˜ao:

min wlT_t₊_uT

cc+uTgg

s.a lt−Lt≤ATx≤ut

ACx≤uc+UCc

AGx≤ug+UGg

0≤Lt≤lt

−uc ≤UCc

UGg ≥0

x≥0.

(3.1)

onde,

w: escalar positivo,

x: dose do sub-raio que entra na imagem para alcan¸car o pixel p, (x∈ ℜn_);

t: t∈ ℜmT_{, t}_≥_0;

c: c∈ ℜmC;

g: g ∈ ℜmG_{, g} _≥_0;

As restri¸c˜oeslt−Lt ≤ATx, ACx≤uc+UCc, e AGx≤ug+UGg, s˜ao denominadas

el´asticas, pois seus limites podem variar de acordo com os vetorest,c, eg, respectivamente.

(28)

penaliza¸cão ou recompensa com rela¸cão à elasticidade. Valores fixos de l, uc, ug, L, UC

e UG definem um conjunto de fun¸cões elásticas. E estas são incorporadas pelas seguintes

razões: 1) a restri¸cão elástica garante que algum conjunto de fun¸cões elásticas, (3.1) é

sempre estritamente fact´ıvel; 2) a diferen¸ca dos limites inferiores nas fun¸c˜oes el´asticas nos

permitem incorporar diferentes objetivos de tratamento.

Considerando que conjuntos diferentes de fun¸c˜oes el´asticas determinam diferentes

filosofias de tratamento a interpreta¸c˜ao do modelo (3.1) depende da escolha deste conjunto.

Em [8] foram propostas as seguintes escolhas, análise média e análise absoluta.

Na an´alise m´edia,

l= 1

mTe,onde l ∈ ℜ

mT_;

uc = _m1

Ce,onde uC ∈ ℜ

mC_;

uG= _m1

Ge,onde uG ∈ ℜ

mG_; _(3.2)

L=I,onde L∈ ℜmT×mT_;

UC =I,onde UC ∈ ℜmC×mC;

UG =I,onde UG ∈ ℜmG×mG.

sendo I a matriz identidade. Esta escolha tem os seguintes objetivos:

• minimizar a dosagem m´edia recebida pelo tumor dentro do limite prescrito;

• minimizar a dosagem m´edia da radia¸c˜ao que a estrutura cr´ıtica recebe, e

• minimizar a dosagem média que o tecido saudável recebe. Na análise absoluta,

l =emT,onde l∈ ℜ

mT_;

uc =emC,onde uC ∈ ℜ

mC_;

uG =emG,onde uG∈ ℜ

mG_; _(3.3)

L=emTe

T

mT,onde L∈ ℜ

mT_;

UC =emCe

T

mC,onde UC ∈ ℜ

mC_;

UG=emGe

T

mG,onde UG∈ ℜ

mG_.

(29)

• minimizar a dosagem m´axima recebida pelo tumor dentro do limite prescrito;

• minimizar a dosagem m´axima da radia¸c˜ao que a estrutura cr´ıtica recebe, e

• minimizar a dosagem m´axima recebida pelo tecido saud´avel.

3.3 Propriedades das Restri¸

c˜

oes El´

asticas

Considere a seguinte defini¸c˜ao:

Defini¸c˜ao A prescri¸c˜ao (ut, lt, uc, ug) admite a uniformidade do tratamento do tumor se

existe um plano, x≥0, tal quelt≤ATx≤ut.

O Teorema abaixo foi demonstrado em [8].

Teorema 3.3.1 Seja(x∗₍_w₎_{, t}∗₍_w₎_{, c}∗₍_w₎_{, g}∗₍_w₎₎_{uma solu¸c˜}_{ao ´}_{otima de (3.1). Para}

qual-quer conjunto de fun¸c˜oes el´asticas temos que lT_t∗₍_w_{) =} _O₍1

w), desde que a prescri¸c˜ao

admita a uniformidade do tratamento do tumor.

Este Teorema mostra que se a prescri¸cão do tratamento é viável, o déficit de radia¸cão no

tumor ´e uniformemente limitada pelo inverso de w. Utilizando este resultado ´e poss´ıvel,

resolvendo apenas um problema de programa¸c˜ao linear, interpretar o resultado e concluir

se existe um tratamento que atende à prescri¸cão violando ou não os limites ug e uc [8].

3.3.1 Interpreta¸

c˜

ao das Solu¸

c˜

oes

Em [8] Holder mostra que quando w= κ_ǫ e o valor ótimo delT_t _{é menor do que} _ǫ_{, então}

a uniformidade na região do tumor é garantida, onde κ é uma constante que depende

dos dados do problema. Portanto, dados w como definido acima e solu¸c˜ao do problema

linear correspondente, podemos interpretar a solu¸cão para as análises média e absoluta

da seguinte forma:

An´alise M´edia

(l =e, uc =e, ug =e)

Caso 1_: _lT_t∗₍_w₎_{> ǫ}_{, conclu´ımos que a prescri¸c˜ao n˜ao permite a uniformidade do tumor.}

(30)

Esta situa¸c˜ao cont´em dois importante subcasos:

Caso 2a: uT

cc∗(w) +uTgg∗(w)>0, a conclusão é que a uniformidade do tumor é acess´ıvel,

mas é cara, pois tecidos saudáveis estão recebendo mais radia¸cão do que desejado.

Caso 2b: uT

cc∗(w) +uTgg∗(w)≤0, a conclusão é que a uniformidade do tumor é permitida,

a soma média de radia¸cão sobre o tecido saudável é no m´ınimo tão boa quanto desejada.

An´alise Absoluta

(l =uc =ug = 1)

Caso 1_: _t∗₍_w₎_{> ǫ}_{, mesma interpreta¸cão da análise média.}

Caso 2_: _t∗₍_w₎_≤_ǫ_{, idem. Esta situa¸c˜ao cont´em dois importante subcasos:}

Caso 2a: uT

cc∗(w) +uTgg∗(w)>0, mesma interpreta¸cão da análise média.

Caso 2b: uT

(31)

(32)

Cap´ıtulo 4

M´

etodos de Pontos Interiores

Aplicados ao Modelo de Tratamento

por Radioterapia

Neste cap´ıtulo aplicaremos os m´etodos de pontos interiores para o modelo (3.1)

con-siderando duas situa¸cões a análise média e análise absoluta.

4.1 An´

alise M´

edia

Adotamos inicialmente a an´alise m´edia(3.2), descrita no Cap´ıtulo 3. Com esta escolha o

problema (3.1) se reduz a:

min w_m1

Te

T_t₊ 1

mCe

T_c₊ 1

mGe

T_g

s.a lt−t≤ATx≤ut

ACx≤uc+c

AGx≤ug+g

0≤t≤lt

−uc ≤c

(g, x)≥0.

Nosso pr´oximo objetivo consiste em obter um problema de programa¸c˜ao linear na forma

(33)

canalizada por lt−t ≤a≤ut e uc+c= ˜c⇒c= ˜c−uc, teremos ent˜ao:

min w 1

mTe

T_t₊ 1

mCe

T_(˜_c₋_u c) + _m1

Ge

T_g

s.a lt−t≤a≤ut

ATx=a

ACx≤c˜

AGx≤ug+g

0≤t≤lt

(˜c, g, x)≥0.

Introduzimos as vari´aveis de folga e desconsideramos a constanteeT_u

c, obtendo o problema

primal:

min w 1

mTe

T_t₊ 1

mCe

T_c₊ 1

mGe

T_g

s.a a+su =ut

a+t−sl =lt

ATx−a= 0

ACx+sc−c= 0 (4.1)

AGx−g+sg =ug

t+st =lt

(t, c, g, x, su, sl, sc, sg, st)≥0,

onde sem perda de generalidade substitu´ımos ˜cpor c. Primeiramente escrevemos a matriz

de restri¸c˜oes de (4.1):

M =



            

I 0 0 0 0 I 0 0 0 0

I 0 I 0 0 0 −I 0 0 0

−I AT 0 0 0 0 0 0 0 0

0 AC 0 −I 0 0 0 I 0 0

0 AG 0 0 −I 0 0 0 I 0

0 0 I 0 0 0 0 0 0 I



            

Encontraremos agora o problema dual. Multiplicando a transposta de M, por y, o vetor

(34)

Mt_y₌                          

I I −I 0 0 0

0 0 At

T AtC AtG 0

0 I 0 0 0 I

0 0 0 −I 0 0

0 0 0 0 −I 0

I 0 0 0 0 0

0 −I 0 0 0 0

0 0 0 I 0 0

0 0 0 0 I 0

0 0 0 0 0 I

                                        yu yl ya yc yg yt               ou seja,

yu+yl−ya= 0

At

Tya+AtCyc+AtGyg ≤0

yl+yt≤w_m1_Te

−yc ≤ _m1_Ce

−yg ≤ _m1_Ge

yu ≤0

−yl ≤0

yc ≤0

yg ≤0

yt ≤0.

Definindo,

(35)

substituindo no sistema anterior, obtemos:

−y˜u+yl−ya = 0

At

Tya−AtCy˜c−AtGy˜g ≤0

yl−y˜t ≤w_m1

Te ˜

yc ≤ _m1

Ce ˜

yg ≤ _m1

Ge ( ˜yu, yl,y˜c,y˜g,y˜t)≥0.

Isso implica que:

−y˜u+yl−ya = 0

At

Tya−AtCy˜c−AtGy˜g ≤0

yl−y˜t ≤w_m1_Te

0≤y˜c ≤ _m1_Ce

0≤y˜g ≤ _m1_Ge

( ˜yu, yl,y˜t)≥0.

Introduzindo agora as vari´aveis de folga z e wtemos:

−y˜u+yl−ya = 0

At

Tya−AtCy˜c−AtGy˜g+zx = 0

yl−y˜t+zt=w_m1

Te

˜

yc +wc = _m1

Ce

˜

yg +wg = _m1

Ge

( ˜yu, yl,y˜c,y˜g,y˜t)≥0

(zx, zt)≥0

(36)

Sem perda de generalidade, tomamos ˜yu = yu; ˜yc = yc; ˜yg = yg; ˜yt = yt e, encontramos

finalmente o problema dual no formato desejado:

max −ut

tyu+lttyl−utgyg−lttyt

s.a −yu+yl−ya= 0

At

Tya−AtCyc−AtGyg+zx = 0

yl−yt+zt =w_m1

Te (4.2)

yc+wc = _m1

Ce

yg+wg = _m1

Ge

(yu, yl, yc, yg, yt, zx, zt, wc, wg)≥0.

As condi¸c˜oes de complementaridade [27] para os problemas (4.1) e (4.2) s˜ao dadas por:

              

YuSue= 0; YlSle= 0

YcSce= 0; YgSge = 0; YtSte = 0

XZxe= 0; T Zte = 0;

CWce= 0; GWge= 0.

(4.3)

As condi¸c˜oes de otimalidade para os problemas (4.1) e (4.2) s˜ao dadas pela factibilidade

primal:                                 

a+su =ut

a+t−sl =lt

ATx−a= 0

ACx+sc−c= 0

AGx−g+sg =ug

t+st =lt

(t, c, g, x, su, sl, sc, sg, st)≥0,

factibilidade dual:                           

−yu+yl−ya = 0

At

Tya−AtCyc−AtGyg +zx = 0

yl−yt+zt=w_m1

Te

yc+wc = _m1_Ce

yg+wg = _m1

Ge

(37)

4.1.1 O M´

etodo Primal-Dual para An´

alise M´

edia

Agora, seguindo os passos descritos no Cap´ıtulo 2, determinamos as dire¸c˜oes do m´etodo primal-dual, para os problemas (4.1) e (4.2) escrevendo primeiramente o Jacobiano:

J=                                                       

I 0 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 0

I 0 I 0 0 0 −I 0 0 0 0 0 0 0 0 0 0 0 0 0

−I AT 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 AC 0 −I 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 AG 0 0 −I 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0

0 0 I 0 0 0 0 0 0 I 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 −I I −I 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 At

T −AtC −AtG 0 I 0 0 0

0 0 0 0 0 0 0 0 0 0 0 I 0 0 0 −I 0 I 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 I 0 0 0 0 I 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 I 0 0 0 0 I

0 0 0 0 0 Yu 0 0 0 0 Su 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 Yl 0 0 0 0 Sl 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 Yc 0 0 0 0 0 Sc 0 0 0 0 0 0

0 0 0 0 0 0 0 0 Yg 0 0 0 0 0 Sg 0 0 0 0 0

0 0 0 0 0 0 0 0 0 Yt 0 0 0 0 0 St 0 0 0 0

0 Zx 0 0 0 0 0 0 0 0 0 0 0 0 0 0 X 0 0 0

0 0 Zt 0 0 0 0 0 0 0 0 0 0 0 0 0 0 T 0 0

0 0 0 Wc 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C 0

0 0 0 0 Wg 0 0 0 0 0 0 0 0 0 0 0 0 0 0 G

                                                      

Multiplicando esta matriz pelas seguintes dire¸c˜oes:

dt _{= (}_d

(38)

                                                                                                              

r1 =ut−a−su

r2 =lt−a−t+sl

r3 =a−ATx

r4 =−ACx−sc+c

r5 =ug−AGx+g−sg

r6 =lt−t−st

r7 =yu−yl+ya

r8 =−AtTya+ACt yc+AtGyg−zx

r9 =w_m1_Te−yl+yt−zt

r10= _m1_Ce−yc−wc

r11= _m1_Ge−yg−wg

r12=µe−YuSuemT

r13=µe−YlSlemT

r14=µe−YcScemC

r15=µe−YgSgemG

r16=µe−YtStemT

r17=µe−XZxe

r18=µe−T ZtemT

r19=µe−CWcemC

r20=µe−GWgemG,

(39)

obtemos assim o sistema linear, Jd=r:

da+dsu =r1 (4.5)

da+dt−dsl =r2 (4.6)

−da+ATdx=r3 (4.7)

ACdx−dc+dsc =r4 (4.8)

AGdx−dg +dsg =r5 (4.9)

dt+dst =r6 (4.10)

−dyu+dyl −dya =r7 (4.11)

At

Tdya −A

t

Cdyc −A

t

Gdyg +dzx =r8 (4.12)

dyl−dyt +dzt =r9 (4.13)

dyc +dwc =r10 (4.14)

dyg +dwg =r11 (4.15)

Yudsu+Sudyu =r12 (4.16)

Yldsl+Sldyl =r13 (4.17)

Ycdsc+Scdyc =r14 (4.18)

Ygdsg +Sgdyg =r15 (4.19)

Ytdst +Stdyt =r16 (4.20)

Zxdx+Xdzx =r17 (4.21)

Ztdt+T dzt =r18 (4.22)

Wcdc+Cdwc =r19 (4.23)

Wgdg+Gdwg =r20. (4.24)

4.1.2 Elimina¸

c˜

ao de Vari´

aveis

As equa¸c˜oes de (4.5) a (4.24) definem o sistema linear que determina as dire¸c˜oes dos

m´etodos de pontos interiores. Este sistema pode ser resolvido diretamente mas esta

op¸cão é muito cara computacionalmente devido à sua grande dimensão. No entanto, este

sistema pode ser reduzido através da substitui¸cão de variáveis de forma similar à redu¸cão

(40)

Isolando as vari´aveis duais de (4.16) a (4.24), obtemos:

dyu =S−

1

u (r12−Yudsu)

dyl =S

−1

l (r13−Yldsl)

dyc =S−

1

c (r14−Ycdsc)

dyg =S−

1

g (r15−Ygdsg)

dyt =S

−1

t (r16−Ytdst)

dzx =X−

1₍_r

17−Zxdx) (4.25)

dzt =T−

1₍_r

18−Ztdt)

dwc =C−

1₍_r

19−Wcdc)

dwg =G−

1₍_r

20−Wgdg)

substituindo em (4.11) `a (4.15):

−S−1

u (r12−Yudsu) +S

−1

l (r13−Yldsl)−dya =r7 ⇒

S−1

u Yudsu−S

−1

l Yldsl−dya =r7+S−

1

u r12−Sl−1r13 =r21

At

Tdya−A

t

CSc−1(r14−Ycdsc)−A

t

GSg−1(r15−Ygdsg) +X−

1₍_r

17−Zxdx) =r8 ⇒

At

Tdya+A

t

CSc−1Ycdsc+A

t

GSg−1Ygdsg−X−

1_Z

xdx =r8+AtCSc−1r14+AtGSg−1r15−X−1r17 =r22

S−1

l (r13−Yldsl)−S−

1

t (r16−Ytdst) +T−

1₍_r

18−Ztdt) = r9 ⇒ −S−1

l Yldsl+S

−1

t Ytdst −T−

1_Z

tdt=r9−Sl−1r13+S−

1

t r16−T−1r18 =r23

S−1

c (r14−Ycdsc) +C−1(r19−Wcdc) =r10 ⇒ −S−1

c Ycdsc −C−

1_W

cdc =r10−Sc−1r14−C−1r19=r24

S−1

g (r15−Ygdsg) +G−

1₍_r

20−Wgdg) = r11⇒ −S−1

g Ygdsg −G−

1_W

gdg =r11−Sg−1r15−G−1r20 =r25.

(41)

abaixo:

S−1

u Yudsu−S

−1

l Yldsl−dya =r21 (4.26)

At

Tdya+A

t CS−

1

c Ycdsc+A

t GS−

1

g Ygdsg −X

−1_Z

xdx =r22 (4.27)

−S−1

l Yldsl+S

−1

t Ytdst −T

−1_Z

tdt=r23 (4.28)

−S−1

c Ycdsc−C

−1_W

cdc =r24 (4.29)

−S−1

g Ygdsg −G

−1_W

gdg =r25. (4.30)

Tomemos agora:

dsu =r1−da

dsl =−r2+da+dt

dsc =Y−

1

c Sc(−C−1Wcdc−r24) (4.31)

dsg =Y−

1

g Sg(−G−1Wgdg−r25)

dst =r6−dt

e substituindo as equa¸c˜oes acima em (4.8), (4.9) e (4.26) a (4.28) temos:

Acdx−dc+Yc−1Sc(−C−1Wcdc −r24) =r4 ⇒

Acdx−(I +Yc−1ScC−1Wc)dc =r4+Yc−1Scr24=r26

Agdx−dg+Yg−1Sg(−G−1Wgdg−r25) =r5 ⇒

Agdx−(I +Yg−1SgG−1Wg)dg =r5+Yg−1Sgr25 =r27

S−1

u Yu(r1−da)−Sl−1Yl(−r2+da+dt)−dya =r21⇒

−(S−1

u Yu+S_l−1Yl)da−S_l−1Yldt−dya =r21−S−

1

u Yur1−Sl−1Ylr2 =r28

At

Tdya+AtCSc−1Yc(Yc−1Sc(−C−1Wcdc−r24))+AGtSg−1Yg(Yg−1Sg(−G−1Wgdg−r25))−X−1Zxdx =

r22 ⇒AtTdya −A

t

CC−1Wcdc−AGt G−1Wgdg−X−1Zxdx =r22+AtCr24+AtGr25=r29

−S−1

l Yl(−r2+da+dt) +St−1Yt(r6−dt)−T−1Ztdt=r23⇒ −S−1

l Ylda−(S−

1

l Yl+S−

1

t Yt+T−1Zt)dt=r23−Sl−1Ylr2 −S−

1

(42)

Restando as seguintes equa¸c˜oes:



            

            

−da+ATdx =r3

Acdx−(I+Yc−1ScC−1Wc)dc =r26

Agdx−(I+Yg−1SgG−1Wg)dg =r27 −(S−1

u Yu+Sl−1Yl)da−Sl−1Yldt−dya =r28

At

Tdya−A

t

CC−1Wcdc−AtGG−1Wgdg−X−1Zxdx =r29 −S−1

l Ylda−(Sl−1Yl+St−1Yt+T−1Zt)dt=r30.

(4.32)

Definimos agora as seguintes matrizes diagonais para simplificar a nota¸c˜ao:

D1 =I+Yc−1ScC−1Wc

D2 =I+Yg−1SgG−1Wg

D3 =Su−1Yu+S_l−1Yl

D4 =Sl−1Yl (4.33)

D5 =C−1Wc

D6 =G−1Wg

D7 =X−1Zx

D8 =Sl−1Yl+S−

1

t Yt+T−1Zt.

Substituindo no sistema (4.32), temos:

−da+ATdx =r3 (4.34)

Acdx−D1dc =r26 (4.35)

Agdx−D2dg =r27 (4.36)

−D3da−D4dt−dya =r28 (4.37)

AtTdya−A

t

CD5dc−AtGD6dg−D7dx =r29 (4.38)

−D4da−D8dt =r30. (4.39)

Isolando dya e dt das equa¸c˜oes (4.37)e (4.39), teremos:

dya =−D3da−D4dt−r28 e (4.40)

(43)

Substitu´ımos na Equa¸c˜ao (4.38), obtemos:

At

T(−D3da−D4dt−r28)−AtCD5dc−AtGD6dg−D7dx =r29 ⇒ −At

TD3da−AtTD4dt−AtCD5dc−AtGD6dg−D7dx =r29+AtTr28 ⇒ −At

TD3da−AtTD4(−D−

1

8 (r30+D4da))−AtCD5dc −AtGD6dg−D7dx =r29+AtTr28⇒

−At

TD3da+AtTD4D8−1D4da−AtCD5dc−AGt D6dg−D7dx=r29+AtTr28−AtTD4D−81r30 −At

T(D3+D4D−

1

8 D4)da−AtCD5dc−AtGD6dg −D7dx =r31. (4.42)

Logo, temos o seguinte sistema linear:

              

ATdx−da =r3

ACdx−D1dc =r26

AGdx−D2dg =r27 −At

TDada−AtCD5dc −AtGD6dg−D7dx =r31,

onde,

Da = (D3−D4D8−1D4). (4.43)

Lembrando que: A =      AT AC AG     

e definindo d=

     da dc dg     

, D =



   

I 0 0

0 D1 0

0 0 D2



   

, rp =

     r3 r26 r27      e ˜ D=     

Da 0 0

0 D5 0

0 0 D6

     .

Podemos reescrever o sistema da seguinte forma:

Adx−Dd=rp (4.44)

−D7dx−AtDd˜ =r31. (4.45)

Isolando d da equa¸c˜ao (4.44), temos:

d=D−1₍_Ad

x−rp). (4.46)

Admitindo-se que a matriz A tem mais linhas (que est˜ao representadas pelo n´umero de

(44)

em (4.45) temos:

−D7dx−ATDD˜ −1Adx+ATDD˜ −1rp =r31⇒

(D7+ATDD˜ −1A)dx =r31−ATDD˜ −1rp =−r˜p.

Logo,

(AT_DD_˜ −1_A₊_D

7)dx= ˜rp. (4.47)

Este sistema é simétrico e definido positivo podendo ser resolvido pela decomposi¸cão de

Cholesky. Sua dimensão é muito menor que o sistema original representado pelas equa¸cões

(4.5) a (4.24).

4.1.3 Resumo do M´

etodo de Pontos Interiores

O m´etodo de pontos interiores desenvolvido nesta se¸c˜ao pode ser resumido da seguinte

forma:

Seja, h= (t, c, g, x, su, sl, sc, sg, st) e j= (yu, yl, yc, yg, yt, zx, zt, wc, wg)

Dado um ponto interior (h0_{, j}0₎

Para k = 1,2,· · ·

Calcule as matrizes diagonais D1 `a D8 por (4.33) e Da por (4.43)

Calcule os res´ıduos:

r1 a r20 por (4.4)

r21 a r25 por (4.26) `a (4.30)

r26 a r30 por (4.35) `a (4.39)

r31 por (4.42)

rp por (4.44) e ˜rp por (4.47)

Calcule d por (4.47),

Calcule as dire¸c˜oes:

dya por (4.40), dt por (4.41),

dsu, dsl, dsc, dsg, dst por (4.31) e

dyu, dyc, dyg, dyt, dzx, dzt, dwc, dwg por (4.25) Calcule ρp por (2.1) e ρd por (2.2)

Calcule αp e αd por (2.3)

(45)

yk+1

a =yak+αddkya

hk+1

p =hk+αkpdkh

j_dk+1 =jk₊_αk ddkj

at´e convergir.

4.1.4 M´

etodo Preditor-Corretor para An´

alise M´

edia

No m´etodo preditor-corretor dois sistemas lineares determinam as dire¸c˜oes.

Primeira-mente é calculada adire¸cão afim (dh, dj, da, dya) resolvendo o sistema linear (4.5) a (4.24) com µ= 0. Em seguida, a dire¸cão desejada é obtida resolvendo o seguinte sistema linear

[13]:                                                                                                               

da+dsu =r1

da+dt−dsl =r2

−da+ATdx =r3

ACdx−dc+dsc =r4

AGdx−dg+dsg =r5

dt+dst =r6

−dyu+dyl −dya =r7

At

Tdya −A

t

Cdyc −A

t

Gdyg +dzx =r8

dyl−dyt +dzt =r9

dyc +dwc =r10

dyg +dwg =r11

Yudsu+Sudyu = ˜r12

Yldsl+Sldyl = ˜r13

Ycdsc +Scdyc = ˜r14

Ygdsg +Sgdyg = ˜r15

Ytdst +Stdyt = ˜r16

Zxdx+Xdzx = ˜r17

Ztdt+T dzt = ˜r18

Wcdc+Cdwc = ˜r19

(46)

onde os novos res´ıduos s˜ao dados por:                                              ˜

r12 =µemT −YuSuemT −Dy˜uDs˜uemT ˜

r13 =µemT −YlSlemT −Dy˜lDs˜lemT ˜

r14 =µemC −YcScemC −Dy˜cDs˜cemC ˜

r15 =µemG−YgSgemG−Dy˜gDs˜gemG ˜

r16 =µemT −YtStemT −Dy˜tDs˜temT ˜

r17 =µe−ZxXe−Dz˜xDxe˜

˜

r18 =µemT −ZtT emT −Dz˜tD˜temT ˜

r19 =µemC −WcCemC −Dw˜cDce˜ mC ˜

r20 =µemG−WgGemG−Dw˜gDge˜ mG

e o parˆametro µ´e calculado da forma descrita no Cap´ıtulo 2.

4.2 An´

alise Absoluta

Trabalhamos agora com aan´alise absoluta(3.3), descrita no Cap´ıtulo 3. Com esta escolha

o problema (3.1) se reduz a:

min weT

mTt+e

T

mCc+e

T mGg

s.a lt−emTe

T

mTt≤ATx≤ut

ACx≤emC +emCe

T mCc

AGx≤emG+emGe

T mGg 0≤emTe

T

mTt≤lt

−emC ≤emCe

T mCc

emGe

T

mGg ≥0

x≥0.

Nosso pr´oximo objetivo consiste em obter um problema linear na forma padr˜ao contendo

(47)

equa¸c˜oes lineares, teremos ent˜ao:

min weT mTt+e

T

mCc+e

T mGg

s.a lt−emTe

T

mTt≤a≤ut

ATx=a

ACx≤emC +emCe

T mCc

AGx≤emG+emGe

T mGg 0≤eT

mTt≤λ

eT

mCc≥ −1

eT

mGg ≥0

x≥0.

Os vetores t, c e g n˜ao tem significado f´ısico e neste modelo s´o nos interessa a soma dos

seus elementos. Assim, criamos uma vari´avel para caracterizar a soma dos elementos de

cada um deles: eT

mTt =τ, e

T

mCc=γ, e

T

mGg =β, obtendo o seguinte problema:

min wτ+γ+β

s.a lt−emTτ ≤a≤ut

ATx=a

ACx≤emC +emCγ

AGx≤emG+emGβ 0≤τ ≤λ

γ ≥ −1

β ≥0

(48)

Tomando ˜γ =γ+ 1 para facilitar o desenvolvimento, e introduzindo as vari´aveis de folga

para obter as equa¸c˜oes de igualdade e temos:

min wτ + ˜γ−1 +β

s.a a+su =ut

a+emTτ−sl =lt

ATx−a= 0

ACx−emCγ˜+sc = 0

AGx−emGβ+sg =emG

τ+σt=λ

(x, su, sl, sc, sg, σt, τ, β,γ˜)≥0,

a:livre.

Retiramos o -1 da fun¸c˜ao objetivo e sem perda de generalidade substitu´ımos γ no lugar

de ˜γ obtemos o problema primal:

min wτ+γ+β

s.a a+su =ut

a+emTτ−sl =lt

ATx−a= 0

ACx−emCγ+sc = 0 (4.48)

AGx−emGβ+sg =emG

τ+σt=λ

(x, su, sl, sc, sg, σt, τ, β, γ)≥0,

(49)

Para encontrar o problema dual, escrevemos a matriz de restri¸c˜oes de (4.48): M =              

I 0 0 0 0 I 0 0 0 0

I emT 0 0 0 0 −I 0 0 0

−I 0 0 0 AT 0 0 0 0 0

0 0 −emC 0 AC 0 0 I 0 0

0 0 0 −emG AG 0 0 0 I 0

0 1 0 0 0 0 0 0 0 1

              .

Multiplicando a transposta de M, por y, o vetor de vari´aveis duais temos:

Mty=

                         

I I −I 0 0 0

0 eT

mT 0 0 0 1

0 0 0 −eT

mC 0 0

0 0 0 0 −eT

mG 0

0 0 AT

T ATC ATG 0

I 0 0 0 0 0

0 −I 0 0 0 0

0 0 0 I 0 0

0 0 0 0 I 0

0 0 0 0 0 1

(50)

ou seja,

yu+yl−ya= 0

eT

mTyl+πt≤w

−eT

mCyc ≤1

−eT

mGyg ≤1

AT

Tya+ATCyc+ATGyg ≤0

yu ≤0

−yl ≤0

yc ≤0

yg ≤0

πt≤0.

Definindo, yu =−y˜u; yc =−y˜c; yg =−y˜g; πt=−π˜t

e substituindo no modelo anterior, obtemos:

−y˜u+yl−ya = 0

eT

mTyl−π˜t ≤w

eT

mCy˜c ≤1

eT

mGy˜g ≤1

AT

Tya−ATCy˜c−ATGy˜g ≤0

( ˜yu, yl,y˜c,y˜g,π˜t,≥0

(51)

Introduzimos agora as vari´aveis de folga z, ζt, ζc e ζg obtemos as restri¸c˜oes na forma de

igualdade:

−y˜u+yl−ya = 0

eT

mTyl−π˜t+ζt=w

eT

mCy˜c +ζc = 1

eT

mGy˜g +ζg = 1

AT

Tya−ATCy˜c−ATGy˜g+zx = 0

( ˜yu, yl,y˜c,y˜g,π˜t, ζt, ζcζgzx)≥0

ya :livre.

Sem perda de generalidade, tomamos ˜yu = yu; ˜yc = yc; ˜yg = yg; ˜πt = πt e, encontramos

finalmente o problema dual no formato desejado:

max −uT

tyu+lTtyl−eTmgyg −λπt

s.a −yu+yl−ya= 0

eT

mTyl−πt+ζt=w

eT

mCyc+ζc = 1 (4.49)

eT

mGyg+ζg = 1

AT

Tya−ATCyc−ATGyg+zx = 0

(yu, yl, yc, yg, πt, ζt, ζc, ζg, zx)≥0

ya:livre.

As condi¸c˜oes de complementaridade para os problemas (4.48) e (4.49) s˜ao dadas por:

    

   

YuSuemT = 0; YlSlemT = 0; YcScemC = 0

YgSgemG = 0; πtσt= 0; τ ζt= 0

γζc = 0; βζg = 0; XZxe= 0.

(52)

As condi¸c˜oes de otimalidade para os problemas (4.48) e (4.49) s˜ao dadas pela factibilidade primal:                                       

a+su =ut

a+emTτ−sl =lt

ATx−a= 0

ACx−emCγ+sc = 0

AGx−emGβ+sg =emG

τ+σt=λ

(x, su, sl, sc, sg, σt, τ, β, γ)≥0,

a:livre,

factibilidade dual:                                 

−yu+yl−ya = 0

eT

mTyl−πt+ζt =w

eT

mCyc+ζc = 1

eT

mGyg+ζg = 1

AT

Tya−ATCyc−ATGyg +zx = 0

(yu, yl, yc, yg, πt, ζt, ζc, ζg, zx)≥0

ya :livre,

e as condi¸c˜oes de complementaridade (4.50).

4.2.1 O M´

etodo Primal-Dual para An´

alise Absoluta

Seguindo os passos descritos no Cap´ıtulo 2, determinamos as dire¸c˜oes do m´etodo primal-dual, para os problemas (4.48) e (4.49) escrevendo primeiramente o Jacobiano:

J=                                                      

I 0 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 0

I 0 e_mT 0 0 0 −I 0 0 0 0 0 0 0 0 0 0 0 0 0

−I AT 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 A_C 0 −e_mC 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 AG 0 0 −e_mG 0 0 0 I 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 −I ₋I I 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 eT

mt 0 0 −1 1 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 eT

mc 0 0 0 1 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 eT_mg 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 AT_T 0 0 −AT_C −AT_G 0 0 0 0 I

0 0 0 0 0 Yu 0 0 0 0 0 Su 0 0 0 0 0 0 0 0

0 0 0 0 0 0 Yl 0 0 0 0 0 Sl 0 0 0 0 0 0 0

0 0 0 0 0 0 0 Yc 0 0 0 0 0 Sc 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Yg 0 0 0 0 0 Sg 0 0 0 0 0

0 0 0 0 0 0 0 0 0 πt 0 0 0 0 0 σt 0 0 0 0

0 0 ζt 0 0 0 0 0 0 0 0 0 0 0 0 0 τ 0 0 0

0 0 0 ζc 0 0 0 0 0 0 0 0 0 0 0 0 0 γ 0 0 0 0 0 0 ζg 0 0 0 0 0 0 0 0 0 0 0 0 0 β 0

0 Zx 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 X

(53)

Obtemos agora os res´ıduos resultantes da aplica¸cão do método de Newton às condi¸cões de otimalidade:                                                                                                               

r1 =ut−a−su

r2 =lt−a−emTτ +sl

r3 =−ATx+a

r4 =−ACx+emCγ−sc

r5 =emG−AGx+emGβ−sg

r6 =λ−τ−σt

r7 =yu−yl+ya

r8 =w−eTmTyl+πt−ζt

r9 = 1−eTmCyc−ζc

r10= 1−eTmGyg −ζg

r11=−ATTya+ACTyc+ATGyg−zx

r12=−YuSuemT +µemT

r13=−YlSlemT +µemT

r14=−YcScemC +µemC

r15=−YgSgemG+µemG

r16=−πtσt+µ

r17=−τ ζt+µ

r18=−γζc +µ

r19=−βζg+µ

r20=−XZxe+µe.

(4.51)

Multiplicamos a matriz do Jacobiano pelas seguintes dire¸c˜oes:

dt _{= (}_d

(54)

aos res´ıduos r= (r1, r2, r3,· · ·, r20), temos, Jd=r:

da+dsu =r1 (4.52)

da+emTdτ −dsl =r2 (4.53)

−da+ATdx =r3 (4.54)

ACdx−emCdγ+dsc =r4 (4.55)

AGdx−emGdβ +dsg =r5 (4.56)

dτ +dσt =r6 (4.57)

−dya−dyu+dyl =r7 (4.58)

eT

mTdyl−dπt+dζt =r8 (4.59)

eT

mCdyc +dζc =r9 (4.60)

eT

mGdyg +dζg =r10 (4.61)

ATTdya −A

T

Cdyc−A

T

Gdyg +dzx =r11 (4.62)

Yudsu+Sudyu =r12 (4.63)

Yldsl+Sldyl =r13 (4.64)

Ycdsc +Scdyc =r14 (4.65)

Ygdsg +Sgdyg =r15 (4.66)

πtdσt +σtdπt =r16 (4.67)

ζtdτ+τ dζt =r17 (4.68)

ζcdγ+γdζc =r18 (4.69)

ζgdβ +βdζg =r19 (4.70)

Zxdx+Xdzx =r20. (4.71)

4.2.2 Elimina¸

c˜

ao de Vari´

aveis

As equa¸c˜oes de (4.52) a (4.71) definem o sistema linear que determina as dire¸c˜oes dos

métodos de pontos interiores para a análise média. Este sistema pode ser resolvido

dire-tamente mas esta op¸cão é muito cara computacionalmente devido à sua grande dimensão.

(55)

Isolando as vari´aveis duais de (4.63) a (4.71), obtemos:

dyu =S−

1

u (r12−Yudsu)

dyl =S

−1

l (r13−Yldsl)

dyc =S−

1

c (r14−Ycdsc)

dyg =S−

1

g (r15−Ygdsg)

dπt =σ

−1

t (r16−πtdσt) (4.72)

dζt =τ−

1₍_r

17−ζtdτ)

dζc =γ−

1₍_r

18−ζcdγ)

dζg =β−

1₍_r

19−ζgdβ)

dzx =X−

1₍_r

20−Zxdx)

substituindo (4.72) em (4.58) `a (4.62):

−dya−S−

1

u (r12−Yudsu) +S_l−1(r13−Yldsl) =r7 ⇒ −dya+S−

1

u Yudsu−S

−1

l Yldsl =r7+S

−1

u r12−Sl−1r13=r21

eT mTS

−1

l (r13−Yldsl)−σ

−1

t (r16−πtdσt) +τ−

1₍_r

17−ζtdτ) =r8 ⇒ −eT

mTS

−1

l Yldsl+σ

−1

t πtdσt −τ−

1_ζ

tdτ =r8+σt−1r16−τ−1r17−eTmTS

−1

l r13=r22

eT mCS

−1

c (r14−Ycdsc) +γ−

1₍_r

18−ζcdγ) = r9 ⇒ −eT

mCS

−1

c Ycdsc−γ−

1_ζ

cdγ =r9−eTmCS

−1

c r14−γ−1r18 =r23

eT mGS

−1

g (r15−Ygdsg) +β−

1₍_r

19−ζgdβ) = r10⇒ −eT

mGS

−1

g Ygdsg −β−

1_ζ

gdβ =r10−eTmGS

−1

g r15−β−1r19=r24

At

Tdya−A

t

CSc−1(r14−Ycdsc)−A

t

GSg−1(r15−Ygdsg) +X−

1₍_r

20−Zxdx) =r11⇒

At

Tdya+AtCSc−1Ycdsc+A

t

GSg−1Ygdsg−X−

1_Z

xdx =r11+AtCSc−1r14+AtGSg−1r15−X−1r20 =r25.