• Nenhum resultado encontrado

2.3 Discuss˜ao dos resultados obtidos

2.3.3 P´os-processamento

Algo que est´a nos parecendo ocorrer a´ı, ´e que talvez n˜ao fa¸ca muito sentido tentar comparar diretamente a “qualidade” da imagem recuperada com parˆametros ´otimos estimados pelos m´etodos L-curve e GCV, pois eles nos fornecem parˆametros com sig- nificados diferentes. Em particular, na literatura da ´area, se tem visto com alguma frequˆencia compara¸c˜oes nesta dire¸c˜ao, ap´os o vigoroso pontap´e inicial nesta dire¸c˜ao de Hansen, conforme relatamos na se¸c˜ao 1.6. Nosso ponto aqui, ´e refor¸car a id´eia que n˜ao faz muito sentido ficar comparando diretamente a “qualidade” das recupera¸c˜oes, diretamente obtidas com os parˆametros ´otimos dos m´etodos GCV e L-Curve, conforme se tem visto ocorrer na literatura pela simples raz˜ao que os dois tˆem voca¸c˜oes bem dife- rentes. Pelo menos no caso de ruidos Gaussianos significativos e com a transformada de Radon, nossos experimentos parecem confirmar para GCV o que a literatura aponta, conforme destacamos na se¸c˜ao 1.4. Ou seja, o parˆametro ´otimo GCV tende a propiciar imagens mais pr´oximas da original, se a medida de proximidade for o erro relativo 2.8 e com menos ruido que aqueles propiciados pela L-curve. Em especial, o m´etodo GCV tende a encontrar valores do parˆametro ¯λ mais altos que o m´etodo L − Curve, para valores significativos do ruido. Por outro lado, L-Curve parece ser bem mais barato com- putacionalmente, apesar de eventualmente necessitar de um p´os-processamento para eliminar ruidos indesej´aveis, conforme discutiremos nesta subse¸c˜ao. No entanto, com a eventual vantagem de manter mais detalhes da imagem original, exatamente por tender a propiciar um valor de ¯λ ´otimo inferior ao do m´etodo GCV.

Nosso objetivo nesta subse¸c˜ao ´e discutir, de forma bem superficial e com o objetivo de apenas trazer a tona o tema, o que acontece se pensamos em p´os-processamento da imagem, um pouco na linha de regularizar o problema alternando passos em dire¸c˜ao `a solu¸c˜ao com filtragem. Basearemos este nosso coment´ario na figura 2.7, que foi produ- zida a partir da imagem 5, medida com um ruido correspondente a ǫ = .04. Nas duas imagens das colunas do centro da figura 2.7, est˜ao as imagens SrLC e SrGCV, corres-

pondentes `as recupera¸c˜oes com os valores ´otimos obtidos com os m´etodos L-curve e GCV. As imagens da coluna da direita, SrLCF e SrGCV F, correspondem `a aplica¸c˜ao

2.3 Discuss˜ao dos resultados obtidos 50 convolu¸c˜ao com uma matriz 3x3 que faz uma m´edia ponderada entre o valor de cada pixel e seus vizinhos imediatos.

Figura 2.7 Nas duas imagens do meio da figura, est˜ao as recupera¸c˜oes da imagem S5, obtidas

com os parˆametros ¯λ ´otimos dos m´etodos L − curve e GCV . Nas duas da direita, estas mesmas imagens filtradas via convolu¸c˜ao com um filtro 3x3

Temos duas observa¸c˜oes a fazer a partir destas imagens.

• A imagem SrLC, recuperada com o parˆametro ´otimo do m´etodo L-Curve ´e visi-

velmente mais ruidosa que SrGCV, al´em de apresentar um erro relativo errelLC =

21.9% quase trˆes vezes superior ao da imagem SrGCV, recuperada com o parˆa-

metro ´otimo do m´etodo GCV . Contudo, ap´os a passagem do filtro, ambas ficam aproximadamente com o mesmo erro relativo em SrLCF e SrGCV F. O mais im-

portante a´ı ´e que alguns detalhes da figura parecem melhor captados em SrLC

2.3 Discuss˜ao dos resultados obtidos 51 situados no canto superior esquerdo da imagem, na parte branca logo acima da coleira preta.

• Embora n˜ao possamos em hip´otese alguma generalizar a partir de poucos exem- plos e nos falte fˆolego para trabalhar esta quest˜ao de forma mais sistem´atica no conjunto das imagens obtidas, nos est´a parecendo que, pelo menos no caso da transformada de Radon, os dois m´etodos de escolha do parˆametro de regu- lariza¸c˜ao teriam voca¸c˜oes inteiramente distintas, no caso de imagens a serem recuperadas que satisfa¸cam razoavelmente `a condi¸c˜ao de Picard e medidas com ruidos iid de m´edia zero. O m´etodo GCV teria como voca¸c˜ao promover a regula- riza¸c˜ao de forma a resultar uma imagem pr´oxima do menor erro relativo poss´ıvel entre a imagem verdadeira e a recuperada, inclusive dispensando o uso de p´os- processamentos. J´a o m´etodo L −curve teria a voca¸c˜ao de regularizar com menos cuidados em evitar ruidos na imagem recuperada, mas em compensa¸c˜ao com uma capacidade maior de conservar detalhes da imagem a ser recuperada e jogaria o papel de filtrar ruidos indesejados para um p´os-processamento da imagem. Uma vantagem aqui estaria no tratamento de grande porte, dado que convolu¸c˜ao com matrizes pequenas ´e muito mais barato que resolver sistemas lineares de grande porte. Sobretudo no caso de se confirmar que h´a um parˆametro assint´otico para a L-curve na recupera¸c˜ao de imagens contaminadas com ruidos relativamente al- tos, como foi o caso do valor ¯λLC = 0.4 em nossos experimentos com N = 1282.

Em particular, isto induziria naturalmente a uma escolha bem mais simples de um parˆametro de regulariza¸c˜ao, possivelmente, n˜ao ´otimo, por´em que regularize o problema inverso e perfeitamente adequado para o caso de se ter em vista um p´os-processamento do sinal recuperado.

Cap´ıtulo 3

Considera¸c˜oes Finais

O foco deste trabalho residiu em estudar numericamente os m´etodos mais empregados na escolha do parˆametro de regulariza¸c˜ao no m´etodo de regulariza¸c˜ao de Tykhonov 1.3 para um problema linear Ax = b mal posto, num caso particular que ´e o da discretiza¸c˜ao da transformada de Rad´on com um regularizador L de diferen¸cas finitas.

Ressaltamos que n˜ao tivemos em momento nenhum a preocupa¸c˜ao de discutir m´e- todos eficientes para resolver problemas concretos grandes como os que surgem na tomografia computadorizada, que usualmente n˜ao trabalham com regulariza¸c˜ao de Tykhonov. Menos ainda com fatora¸c˜ao GSVD, que ´e um m´etodo caro demais para as dimens˜oes de interesse da tomografia m´edica. Nosso foco nesta disserta¸c˜ao consistiu em tentar entender como se comportam os m´etodos de Tykhonov com parˆametros de regulariza¸c˜ao ´otimos definidos via L-curve (LC), valida¸c˜ao cruzada generalizada (GCV) ou discrepˆancia num caso particular de problema mal-condicionado importante.

No cap´ıtulo 1 levantamos os aspectos te´oricos que julgamos relevantes sobre o tema. Em parte, para propiciar uma explica¸c˜ao razoavelmente auto-consistente ao leitor do que se trata. Em parte, para situar os principais aspectos te´oricos que decidimos testar numericamente e/ou com os quais decidimos dialogar em nossos experimentos num´e- ricos no cap´ıtulo 2. Na se¸c˜ao 3.1 resumimos as principais conclus˜oes a que chegamos. Vale ressaltar que todas elas se referem a experimentos com um dado operador linear discretizado, numa ´unica dimens˜ao, com 12 imagens 128 × 128, cuidadosamente esco- lhidas para representar diferentes condi¸c˜oes de Picard e adicionando 6 n´ıveis diferentes de ruidos gaussianos iid `as medidas com a transformada de Rad´on. Obviamente n˜ao temos a pretens˜ao que nossas conclus˜oes valham em geral, muito embora possamos ter a expectativa que algumas delas possam continuar v´alidas em testes com outros ope- radores e diferentes dimens˜oes dos problemas, pelo menos no caso de ru´ıdos gaussianos iid. Na se¸c˜ao 3.2 situamos linhas de trabalho futuros a partir desta disserta¸c˜ao.

3.1 Conclus˜oes 53

3.1 Conclus˜oes

1. O primeiro ponto que gostar´ıamos de ressaltar est´a no entendimento que julgamos ter adquirido sobre a natureza dos m´etodos GCV e L-curve. GCV ´e um m´etodo que foi desenhado com heur´ısticas sofisticadas e que visavam procurar aproximar a solu¸c˜ao regularizada ¯x¯λ da solu¸c˜ao verdadeira, num dado sentido, e nisto ˆele

se mostrou muito bom em nossos testes. Por isto mesmo, no caso de medidas b = Ax∗+ r com ru´ıdos krk relativamente elevados, ˆele acaba acompanhando o

sinal ¯xλ¯EM in, definido como o que corresponde ao sinal da fam´ılia ¯xλ¯ mais pr´oximo

da imagem verdadeira x∗ que se quer recuperar. Com isto, o parˆametro definido

pelo m´etodo GCV acaba suavizando o sinal de forma crescente com o tamanho do ru´ıdo e tende a suavizar detalhes mais finos da imagem a ser recuperada. J´a o m´etodo L-curve parte de uma id´eia simples, mas poderosa, sobre a natureza das diferentes respostas de um operador mal condicionado a sinais razoavelmente ’‘bem comportados”, no sentido de atender `a condi¸c˜ao de Picard para a fatora¸c˜ao GSVD, contra o que acontece a ruidos com distribui¸c˜ao mais ou menos homogˆenea em qualquer base razoavelmente bem condicionada do Rn. Pensando no m´etodo

de Tykhonov a partir da fatora¸c˜ao GSVD, o desenho b´asico do m´etodo L-curve corresponde a detectar um ponto a partir do qual o ruido ´e suficientemente filtrado pelo parˆametro definido como ´otimo e deixa de competir com o sinal verdadeiro a ser recuperado. O que ele nos parece fazer bem ´e regularizar o problema colocado com um valor do parˆametro ´otimo bem abaixo dos que surgem nos outros dois m´etodos, mantendo desta forma bem mais detalhes do problema original que o m´etodo GCV. Al´em de ser bem mais barato computacionalmente que GCV, caso se opte por n˜ao usar GSVD. Por outro lado, os sinais que ele recupera tendem a ficar crescentemente bem mais ruidosos com o n´ıvel do ruido nas medidas, do que acontece com os demais m´etodos, provavelmente a exigir algum tipo de p´os-processamento no caso de medidas com n´ıveis de ruido elevado, conforme a aplica¸c˜ao. N˜ao podemos ter certezas que isto tamb´em aconte¸ca com outros operadores, mas ainda assim nos surpreende a existˆencia de v´arios trabalhos na literatura (vide se¸c˜ao 1.6) tentando comparar a qualidade da recupera¸c˜ao de imagens com os parˆametros ´otimos gerados pelos m´etodos GCV e L-curve, inclusive trabalhos que o fazem utilizando a transformada de Rad´on...

2. A argumenta¸c˜ao de Hansen em 1.3, a favor de se usar o m´etodo da L-curve na escala loglog tem uma natureza essencialmente heur´ıstica e prevaleceu na litera- tura, pois ´e o que vem sendo empregado usualmente. Contudo, muitos trabalhos

3.1 Conclus˜oes 54 relatam dificuldades com a L-curve e n´os encontramos uma ambiguidade na de- fini¸c˜ao dos pontos de m´aximo da curvatura que julgamos ter conseguido superar adequadamente com o algoritmo 2.2.1 que definimos e justificamos na subse¸c˜ao 2.2.2 e no apˆendice D. Num primeiro momento, nos pareceu que o m´etodo da L-curve at´e funcionaria melhor na escala linlin, pois nesta escala a curvatura aparentemente apresentava pontos de m´aximo sem maiores ambiguidades e es- sencialmente parecidos com os que se acaba encontrando para a L-curve com o m´etodo que definimos. Contudo, julgamos ter encontrado um argumento defini- tivo contra o uso da L-curve na escala linlin, que est´a na subse¸c˜ao 1.3.1 e que corresponde ao fato das solu¸c˜oes ´otimas passarem a depender fortemente de uma mudan¸ca de escala no regularizador, o que nos parece inaceit´avel. J´a na escala loglog e nos demais m´etodos empregados isto n˜ao acontece.

3. Uma caracter´ıstica muito relevante do m´etodo L-curve que nos apareceu nos tes- tes corresponde a uma tendˆencia dos pontos ´otimos neste m´etodo se agruparem em torno do valor ¯λ = 0.4, para os n´ıveis mais altos de ru´ıdo e de irem decrescendo com n´ıveis de ruidos decrescentes. Uma observa¸c˜ao que nos parece auspiciosa con- siste em correlacionar estes valores para ¯¯λLC ≈ 0.4 `a caracter´ısticas da curva de

valores singulares generalizados do par A, L, no sentido de dizer que estes valores caem exatamente no meio de uma estreita faixa de valores singulares generaliza- dos entre o de ordem 5200 e o de ordem 5600, na qual a curva de valores singulares sofre uma inflex˜ao importante entre duas partes nas quais a varia¸c˜ao dos valores singulares ´e muito mais lenta, conforme descrevemos nas figuras 2.2-2.3 da subse- ¸c˜ao 2.2.2. O ponto not´avel a se destacar corresponde a observar que o parˆametro de ´otimo encontrado pelo m´etodo L-curve funciona efetivamente como um filtro para as componentes dos vetores singulares da imagem recuperada, correspon- dente aos valores singulares abaixo desta faixa estreita de varia¸c˜ao mais brusca. Ainda n˜ao temos uma explica¸c˜ao matem´atica que nos pare¸ca convincente para justificar o que ocorre aqui e sequer podemos afirmar com seguran¸ca que tal fato n˜ao seja mera coincidˆencia neste caso particular, muito embora acreditemos que n˜ao seja mera coincidˆencia. Uma vantagem importante que vemos a´ı, corresponde a se ter um bom chute inicial para o m´etodo, quase que independentemente da imagem e dependendo essencialmente do operador A e do regularizador L. Ainda mais levando-se em conta que algum tipo de p´os-processsamento parece reco- mend´avel para filtrar excessos de ruidos, de qualquer modo. Em especial, um dos objetivos iniciais desta disserta¸c˜ao consistia em procurar entender melhor esta

3.2 Trabalhos futuros 55

Documentos relacionados