Estimativa do perfil da concentração de clorofila em águas naturais através de um perceptron de múltiplas camadas.

(1)

Uma Publiação daSoiedade BrasileiradeMatemátiaApliadaeComputaional.

Estimativa do Perl da Conentração de Clorola

em Águas Naturais Através de um Pereptron de

Múltiplas Camadas

1

F. DALL CORTIVO 2

, Programa de Pós-Graduação em Computação Apliada,

CAP,InstitutoNaionaldePesquisasEspaiais,INPE,Av. dosAstronautas,1758,

12227-010SãoJosédoCampos,SP, Brasil.

E.S. CHALHOUB, H.F. CAMPOS VELHO, Laboratório Assoiado de

Compu-tação e Matemátia Apliada, LAC, Instituto Naional de Pesquisas Espaiais,

INPE,Av. dosAstronautas,1758,12227-010São JosédoCampos,SP,Brasil.

Resumo. Estimativadoperldeonentraçãodelorola, emáguasnaturais,a

partirdaradiaçãoemergentenasuperfíiedeumorpod'água,omousoderede

neuralartiialdotipoPereptrondeMúltiplasCamadas. Aonentraçãode

lo-rolaestárelaionadaomosoeientesdeabsorçãoeespalhamentoviamodelos

bio-óptios. Otreinamentodaredeéformuladoomoumproblemadeotimização,

noqualaatualizaçãodasvariáveislivresdarede(pesos,viéseparâmetrosdeada

função deativação)éfeitaatravésdométodoquasi-Newton.

Palavras-have. Pereptrondemúltiplas Camadas, métodoquasi-Newton,

on-entraçãodelorola,equaçãodetransferêniaradiativa.

1. Introdução

Neste trabalho a interação de um feixe de fótons om um orpo d'água é

repre-sentada pela Equação de Transferênia Radiativa (ETR). Dadas as ondições de

ontorno, o termo fonte e as propriedades ótias inerentes, é possível resolver a

ETRe,assim,determinaraquantidadedepartíulas(fótons)queestãoemergindo

nasuperfíieda águaapósainteraçãoom omeio. Aoabordar oproblemadessa

forma, arateriza-seoqueéhamadodeproblemadireto. Oorrespondente

pro-blemainversoonsisteemdeterminarumaoumaispropriedadesfísias(fontes

inter-nas,ondiçõesdeontorno,propriedadesótias)apartirdasmedidasradiométrias

(radiânias) emergentes e/ou do interior do orpo d'água. A resolução numéria

da ETR érealizada om oódigoPEESNA [3℄, oqual implementa ométodo

S

N

analítio(

AS

N

)[1℄.

1

AgradeçoaCAPESpeloauxilionaneirodurantearealizaçãododoutorado.

2

(2)

Nomenlatura

θ

ângulopolar

rad

I

(

τ, µ, ϕ, λ

)

radiânia

cd

τ

variávelótiadeprofundidade

µ

o-senodoângulo polar (

cos

θ

)medido apartirdo

eixopositivo

τ

ϕ

ânguloazimutal

rad

λ

omprimentodeonda

nm

ζ

profundidadeótia

Θ

ângulo de espalhamento formado pelas direções

{µ

′

_{, ϕ}

′

_}

S

0

(

τ, λ

)

fonteinternaderadiação

cd

I

0

radiâniainidente nasuperfíie

cd

µ

0

o-senodoângulopolardeinidênia

ϕ

0

ânguloazimutaldeinidênia

rad

δ

(

· )

funçãodelta deDira

I

s

(

τ, µ, ϕ

)

omponente deradiâniaespalhada

cd

I

u

(

τ, µ, ϕ

)

omponente deradiânianão-espalhada

cd

L

ordemdeespalhamento

C

(

τ

)

onentraçãodelorola

mg

· m

−

3

a

w

λ

oeientedeabsorçãodaáguapura

m

−

1

a

c

λ

oeientedeabsorçãoespeíoda

C

(

τ

)

b

(

τ, λ

)

oeientedeespalhamentodaáguapura

m

−

1

x

j

entrada

j

deumvetordepadrões

w

ji

pesosináptio queliga aentrada

j

aoneurnio

i

b

i

viésdoneurnio

i

φ

funçãodeativação

v

i

ampoloalinduzidodoneurnio

i

a

oeientequeindiaainlinaçãodafunçãode

ati-vação

E

_t

matrizqueontemtodosospadrõesdeentradapara

otreinamento

W

matrizqueontemtodosospesossináptios

B

matriz/vetorqueontemtodososviés

A

matrizqueontemtodososoeientesqueindiam

ainlinaçãodasfunçõesdeativação

M

númerototaldeneurniosnaamadadesaída

T

númerototaldepadrõesdetreinamento

O

t

ij

entrada

ij

da matriz de padrões de saída para o

treinamento

(3)

a

ℓ

∗

valormáximo/mínimoqueooeientede

inlina-çãodasfunçõesdeativaçãopodeatingir

w

k

∗

valor máximo/mínimoqueos pesos sináptios

po-dematingir

b

l

∗

valormáximo/mínimoqueosviéspodem atingir

X

vetorontendo

w, b

e

a

iniiais

∇

operadorgradiente

H

−

1

matrizHessianainversa

R

nívelderuído

G

grupodepadrões

T A

taxadeaerto

N

µ

númerodedireçõesdisretasonsideradaspara

me-diçãodaradiaçãoemergente

EQM

erroquadrátiomédio

N

p

númerototaldepadrõesnoonjuntodevalidação

chl

e

i

onentraçãodelorolaexata

mg

· m

−

3

chl

e

n

onentraçãodelorolaestimada pelarede

mg

· m

−

3

Oproblemainversopodeserformuladoomoumproblemadeotimização,

bus-andosoluçõesregularizadas. Essaabordagem,hamadadeimplíita,foi utilizada

para resolver problemas, nos quais se desejou estimar pers vertiais da

onen-tração de lorola [21℄. Apesar dos bons resultados obtidos, a omplexidade do

problemainverso/diretofezneessárioautilização deproessamentoparalelopara

a resolução [21, 23℄. A resolução de ótia hidrológia inversa por esta estratégia

requer enorme usto omputaional. Gordon [9℄ faz uma revisão de ténias de

soluçãoem váriosproblemasinversosemÓtiaHidrológia.

Uma estratégia para reduzir o tempo omputaional na resolução deste tipo

de problemainversoé autilização de RedesNeuraisArtiiais(RNAs) [7, 19, 5℄,

devidoaapaidadeintrínseadesses sistemasemaproximarfunções[12℄.

Estimativasdaonentraçãodeloroladesuperfíieemáguasnaturais(além

de outraspropriedades), apartirda reetâniamedida porsatélites,já temsido

realizadasatravésdeRNAs[14,13,11℄. Nessestrabalhos,ospadrõesdeentradada

redesãoformadospelas reetâniasmedidas nasbandas(omprimentosdeonda)

dovisível, sendoqueovalor médio deada bandaorrespondeauma entradada

rede. Emnossoestudo,ospadrõesdeentradaneessáriospara treinar evalidara

redesãoformadospelaradiação(radiânia)emergentenasuperfíie,sendoqueada

direção(polar)disretaonsideradaorrespondeaumaentradadarede. Ométodo

deinversãobaseadoemRNAserátestadoommedidasderadiâniassintétias,em

queradiâniassãoaluladasapartirdasoluçãodaETR(problemadireto). Para

osoeientesdeabsorçãoeespalhamento,sãoempregadosmodelosbio-óptios[16,

10℄, nosquaisestes oeientes sãodadosem funçãodaonentraçãodelorola.

A soluçãoinversaé obtidaatravésde uma RNA dotipoPereptronde Múltiplas

Camadas(MLP).Otreinamentodaredeéfeitoatravésdaminimizaçãodofunional

de diferença quadrátia entre as respostas dadas pela rede os padrões de saída

(4)

inlui,alémdepesoseviés,oparâmetrodasfunçõesdeativação.

2. Formulação do Problema Direto

AETRéummodelomatemátioutilizadopararepresentarainteraçãodeumfeixe

deluz(fótons)omumorpod'água. Emmuitasapliações,prinipalmenteaquelas

queenvolvemoestudodainteraçãodessefeixedeluzomáguasoeânias,é

plau-sívelonsiderarque oorpod'água apresente variaçõessigniativas,omrelação

aosseusonstituintes,apenasomaprofundidade. Nesteaso,denomina-seoque

éhamadode geometriaplano-paralela. A ETRpara estetipodegeometria, om

dependêniaespetral,azimutalepolar,eespalhamentoanisotrópioédadapor

µ

∂

∂τ

I

(

τ, µ, ϕ, λ

) +

I

(

τ, µ, ϕ, λ

) =

b

(

τ, λ

)

c

(

τ, λ

)

Z

1 −

1

Z

2 π

0

Z

λ

p

(cos Θ

, λ

)

I

(

τ, µ

′

_{, ϕ}

′

_{, λ}

′

₎

_dλ

′

_dϕ

′

_dµ

′

₊

_S

0

ζ

é a espessura ótia do meio,

µ

∈

[

−

1 ,

1]

,

ϕ

∈

[0

,

2 π

]

e,

representam, respetivamente, oo-senodo ângulo polar medido a partirdo eixo

positivo

τ

e o ângulo azimutal, os quais espeiam a direção de propagação

Θ

da radiaçãono meio e

λ

éo omprimento de ondado fóton. Otermo

b

(

τ, λ

)

é o

oeiente deespalhamento,

c

(

τ, λ

) =

a

(

τ, λ

) +

b

nadireção

{µ

′

_{, ϕ}

′

_{, λ}}

aserespalhadonadireção

{µ, ϕ, λ}

,e

S

0

(

τ, λ

)

éuma fonte

interna deradiação. Asondiçõesdeontorno, assoiadasao problemaabordado,

sãodadaspor

I

(0

, µ, ϕ, λ

) =

I

0

δ

(

µ

−

µ

0

)

δ

(

ϕ

−

ϕ

0

)

e

I

(

ζ,

−µ, ϕ, λ

) = 0

,

(2.2)

emquee

I

0

éaradiâniainidentenasuperfíie,

µ

0

éoossenodoângulopolarde

inidênia,

ϕ

0

éoânguloazimutaldeinidêniae

δ

(

· )

éafunçãodeltadeDira.

Pararesolveroproblemadenidopelaequação(2.1),sujeitaàsondiçõesdadas

pelas equações (2.2), efetua-se uma disretização espaial eespetral[2℄. Há um

desaoplamentopara adaomprimentode ondae aquiadependêniado

ompri-mentodeondaserátomadoumvalormédio,isto é,

I

λ

(

τ, µ, ϕ

) =

1 ∆

λ

Z

λ

+∆

λ

I

(

τ, µ, ϕ, λ

)

dλ.

A m de simpliar a notação não será grifado a dependênia do omprimento

de onda

passa a serexpressa omo sendo a

somadessasomponentes,

(5)

Paraobterasoluçãoparaaomponentenão-espalhada,onsidera-se

b

(

τ, λ

) = 0

naequação (2.1), sujeitoàs ondições(2.2)e, então, resolve-seaequação

diferen-ial parial resultante. Já para a omponente espalhada

I

s

(

τ, µ, ϕ

)

, iniialmente aproxima-seafunçãodefasedeHenyey-Greenstein[15℄emumasérienitade

fun-çõesdeLegendreassoiadas,eemseguidautiliza-seadeomposiçãodeFourierem

o-senos [4℄, sobre o ângulo azimutal, de modo a gerar

L

+ 1

equações

integro-diferenias (ETRs), sem a dependênia de

ϕ

. Otermo integral presente em ada

equaçãoíntegro-diferenialéaproximadopelométododaoloação,oqualonsiste

emsubstituiraintegralangularporumesquemadequadraturadeGauss-Legendre.

Essaaproximaçãoproduzumonjuntode

N

equaçõesdifereniaisordináriasde

pri-meiraordempara adaânguloazimutal. Asoluçãoanalítia,paraadaumdesses

onjuntos,éobtidaatravésdométodo

AS

N

,queébaseadonadeomposição espe-traldamatrizdeespalhamento. Paraaaproximaçãonumériaéutilizadooódigo

PEESNA[3℄,oqualimplementaométodo

AS

N

.

Arelaçãoentre osoeientesdeabsorçãoeespalhamentoomaonentração

delorolaéfeitaatravésdemodelosbio-óptios. Segundo[16℄e[10℄,asexpressões

que relaionam a onentração de lorola om aabsorção e o espalhamento são

dadas,respetivamente,por

a

(

τ, λ

) =

a

w

λ

+ 0

.

06 a

c

λ

C

0 .

65

₍

_τ

₎

h

1 + 0

.

2 e

−

0 .

014(

λ

−

440)

i

_,

e

b

(

τ, λ

) =

b

w

λ

+

550 λ

0 .

3 C

0 .

62

₍

_τ

₎

_,

emque

a

w

λ

e

b

w

λ

são,respetivamente,ooeientedeabsorçãoeespalhamentoda

águapura,ujosvalorespodemserenontradosem[17℄,

λ

representaoomprimento

deonda,

a

c

λ

éumoeientedeabsorçãoespeíodaonentraçãodelorola,ujo

valorpodeserenontradoem[20℄,e

C

(

τ

)

éaonentraçãodelorola,aqual,para

o presente trabalho, é onsiderada onstante. Por m, mais detalhes aera da

soluçãopara oproblemadenidonessaseçãopodemserenontradosem[2℄.

3. Pereptron de Múltiplas Camadas

Um MLP é obtido através da onexão de vários neurnios entre si, de modo a

formaremuma rede. Essa redeéonstituída deuma amada deentrada, umaou

maisamadasoultas,eumaamadadesaída. Nessemodeloderede,ainformação

épassadaadianteamadaporamadaatéatingiraamadadesaída. Ainformação

quehegaemadaumadasunidadesdeproessamentoequedeveráserproessada

poressasunidades,édenidamatematiamentepor

v

i

=

P

j

w

ji

x

j

+

b

i

,emque

x

j

representaasinformaçõesdeentrada,

w

ji

asonexõesentreosneurnios(sinapses), e

b

i

éhamadodeníveldeviés,epodeserinterpretadoomoumvalorqueéajustado a m de omplementar alguma atividade presente no neurnio biológio, mas

não presente no neurnioartiial. Essainformaçãoéproessadaatravésde uma

funçãode ativação

φ

, aqual tempornalidade restringir aamplitudedo sinalde

(6)

tangentehiperbóliaeafunçãolinear,denidas,respetivamente,por

φ

(

v

) =

1 1 +

e

−

av

,

a >

0 ,

φ

(

v

) =

1 −

e

−

av

1 +

e

−

av

,

a >

0

e

φ

(

v

) =

av,

a

∈ R

∗

_.

RedesdotipoMLPsrequeremumtreinamentodotiposupervisionado,ouseja,

oma presençade umprofessor que temo onheimento doambiente quea rede

deverá aprender. Esse ambiente é representado por um onjunto de entradas e

saídasonheidas. Duranteafasedeaprendizagem,oprofessorapresentauma

de-terminada entrada à rede, que por sua vez proessa a informação apresentada e

devolveumasaída. Asaídaaluladapelaredeéomparadaomasaídadesejada,

eomissoégeradoumsinaldeerro, oqualépropagadoparatrás

(retropropaga-ção)atravésdo algoritmode treinamento. Durante a retropropagaçãodo erro, o

algoritmodetreinamento,baseadoemalgumaregra,fazumaorreçãonasvariáveis

livres da rede de modo a orrigir os valoresdos seus parâmetros livres, a m de

minimizar oerro ometido. Dessa forma, espera-se que a redeaprenda afazer a

orretaassoiaçãoentre ospadrõesdeentradaeospadrõesdesaída.

4. Formulação do Problema Inverso

Aformulaçãoparaotreinamento,desritaabaixo,segueaadotadaem[6℄,enessa

formulação,otreinamento ésupervisionadoedotipobath [12℄.

Para otreinamento, foi denido umfunional

J

(

· )

que édadopela somadas

diferençasquadrátiasentreospadrõesdesaídautilizados paraotreinamentoeas

respostasobtidaspela redepara adapadrãode entrada,e paraoqual busou-se

umvalormínimo,ouseja,

J

(

E

_t

_,

W

_,

B

_,

A

_{) = min}

T

X

j

=1

M

X

i

=1

O

t

ij

−

O

n

ij

2

,

(4.1)

em que

E

t

,

W

,

B

e

A

são matrizes que ontem, respetivamente, os padrões de entrada para o treinamento, os pesos sináptios, os biases e os parâmetros das

funções de ativação. Já

M

representa o número total de neurnios na amada

de saída,

T

representa o número total de padrões de treinamento,

O

t

ij

e

O

n

ij

representam,respetivamente,adaentradadasmatrizesqueontemospadrõesde

saídaparaotreinamentoeassaídasaluladaspelarede. Outrosdetalhesem[6℄.

Note que é neessário inluir restrições às variáveis que estão sendo

otimiza-das,espeialmenteàsrelaionadasomoparâmetrodasfunçõesdeativação. Pela

denição dasfunçõessigmóideetangentehiperbólia,estesparâmetrosdevem ser

positivose,portanto,osvaloresótimos paraessesparâmetrosdevemsatisfazer

0 < a

ℓ

_≤

_a

ℓ

max

,

(4.2)

em que

a

ℓ

max

é umvalor máximopré-denido,am deevitar queeste parâmetro

(7)

exponen-linear,arestriçãodadapelaequação(4.2)podesersubstituídapor

−a

ℓ

min

≤

a

ℓ

_≤

_a

ℓ

max

,

a

ℓ

₆

_{= 0}

_,

(4.3)

emque

a

ℓ

min e

a

ℓ

max

sãovaloresmínimosemáximos,respetivamente,pré-denidos

amdeevitarumoverow.

Otreinamentodaredepodeenvolverumafunçãoommúltiplosmínimosloais,

o quetorna difíil garantir que seráenontrado um mínimoglobal. Diante disso,

pareeseratraenteaidéiadereduziroespaçodebusae,então,busarporum

mí-nimoloaldentrodessesub-espaçogerado,desdequeesseproduzabonsresultados.

Areduçãodoespaçodebusaéobtidooloandorestriçõesnasdemaisvariáveisa

serem otimizadas, ouseja, nos pesos enos viés. Portanto, durante o proessode

treinamento sãobusadosvaloresparaamatriz

W

eparamatriz/vetor

B

demodo

queestessatisfaçamasrestrições

−w

k

min

≤

w

k

_≤

_w

k

max

−b

l

min

≤

b

l

_≤

_b

l

max

,

(4.4)

em que

w

k

∗

está assoiado às restrições aos pesos,

b

l

∗

está assoiado às restrições

aos viés. Outra vantagem que surge om a inlusão dessas restrições nos pesos

e viés, é o fato que é possível evitar que esses parâmetros assumam ordens de

grandezaelevadase,assim,evitarasaturaçãodosneurnios,fatoessenãodesejado

poisprejudiaotreinamento. Portanto, durante otreinamentoda rede,ométodo

utilizadobusa um mínimo parao funional denido naequação (4.1), sujeito às

ondiçõesexpressaspelasequações(4.2)e/ou(4.3)e/ou(4.4).

Nestetrabalho,paraaminimizaçãodofunionaldenidonaequação(4.1),é

uti-lizado ométodoquasi-Newtonimplementadonasub-rotinaE04UCFdabibliotea

NAG, desenvolvidapor Numerial Algorithms Group NAG [18℄. Optou-se pela

utilização da bibliotea itada em função da robustez da mesma para soluçãode

problemasdeotimizaçãonão-lineares,epelapossibilidadedainlusãodasrestrições

omentadasanteriormente,ver[5,6℄.

Para o treinamento, as variáveis a serem otimizadas (pesos, viés e parâmetro

das funçõesde ativação) são organizadasem umvetor

X

= [

W B A

]

T

. Durante

esseproesso,abiblioteaproura umvalor

X

∗

para

X

,demodoque

∇J

(

· , X

X

∗

_{) = 000}

_,

(4.5)

eaindalevaemonsideraçãoque

X

∗

satisfazasondiçõesexpressaspelasequações

(4.2)e/ou(4.3)e/ou(4.4). Agora,se

X

k

+1

=

X

k

+ ∆

X

k

aproximaoponto

X

∗

na

(

k

+ 1)

-ésimaiteração, então, fazendo aaproximação deprimeira ordem em série

deTaylorparaaequação(4.5) emtornodoponto

X

k

+1

, obtém-se

X

k

+1

=

X

k

+

H

−

1

_∇J

₍

_·

_{, X}

_X

k

)

,emque

H

−

1

éamatrizHessianainversaem

X

=

X

k

. Naprátia,a inversa

H

−

1

nãoéaluladadeformaexata,esimdeumaformaaproximada. Para

isso, onsidereque

X

k

é um ponto iniiale

H

−

1 k

é uma aproximaçãodaHessiana

inversa, e que respeita as ondições denidas em [8℄. Então, primeiramente, o

algoritmo alula o gradiente de

J

em

X

k

, em segundo alula uma direção de busadenida pela expressão

d

k

=

−

H

−

1

(8)

de modo que

X

k

+1

=

X

k

+

α

k

d

k

, em que

α

k

é o tamanho do passo e, por m, atualiza

H

−

1 k

atravésdaexpressão

H

−

1 k

+1

=

H

−

1 k

−

H

−

1 k

S

k

S

T

k

H

−

1 k

S

k

,

H

−

k

1

S

k

+

S

k

S

T

k

hY

Y

k

, S

S

k

i

,

emque

S

k

=

X

k

+1

−

X

k

e

Y

k

=

∇J

(

·, X

X

k

+1

)

− ∇J

(

·, X

X

k

)

. Detalhesdabibliotea edométodoquasi-Newtonpodem serenontradosem[18℄e[8℄, respetivamente.

5. Conjuntos de Treinamento, Validação e T

reina-mento da Rede

Nestaseçãodesreve-seomosãogeradososonjuntosdetreinamentoede

valida-ção. Comooformalismomatemátioparaaformulaçãodoproblemadetreinamento

foi desrito na seção anterior, aqui sãoabordadosapenas osdetalhes do

proedi-mentodetreinamento.

5.1. Conjuntos de Treinamento e Validação

Ambos onjuntos, de treinamento e de validação, utilizados neste trabalho, são

obtidosapartirdaresoluçãodoproblemaexpostonaSeção2.

Paraestetrabalho,adotou-seumaúniaregiãoespaialenessaregião

(profun-didadeótia)onsiderou-sequeoperldaonentraçãodelorola

C

éonstante,

ouseja,umvalor médionaregião. A partirdoparâmetro

C

, épossívelresolvero

problemadenidonaquelaseção,determinandoaradiaçãoemergentenasuperfíie

após ainteraçãodessaomomeio,em direções(o-senodo ângulopolar)

esolhi-dasa priori. Sãoesses valoresdaradiação emergenteque onstituirãoospadrões

de entrada para o treinamento e validação/teste da rede. As direções disretas

adotadasorrespondemaumtotaldedezigualmenteespaçadasepertenentesao

intervalo

θ

∈

[90

◦

_,

₁₃₅

◦

_]

. Paraoânguloazimutaladotou-se

ϕ

0

= 0

◦

. Comrelação

àonentraçãodelorolaadotou-se

C

∈

[0

.

01 ,

10 .

0]

.

Para gerar o onjunto de treinamento, esse intervalo foi disretizado omo

C

= [0

.

01 ,

0 .

02 ,

0 .

03 , . . . ,

0 .

1 ,

0 .

15 ,

0 .

2 ,

0 .

3 ,

0 .

4 , . . . ,

9 .

8 ,

9 .

9 ,

10 .

0]

, gerando 110

valoresdisretos 3

. Já parageraroonjuntode validação,adotou-seuma

disreti-zaçãoigualmenteespaçadaomumtamanhodepassode

∆

C

= 0

.

01

,gerando1000 valoresdisretos. Portanto,adapadrãodeentrada(soluçãodoproblemaparaada

valordisreto de

C

)de ambosonjuntos(treinamento evalidação) éompostode

dez entradas, e ada padrão de saída é ompostopelo respetivo valor de

C

que

gerou o padrão de entrada. Note que onúmero total de padrões no onjunto de

treinamento é110,enoonjunto devalidaçãoé1000.

Porm,valelembrarqueadavalorde

C

orrespondeaumdadodeentrada,ea

radiaçãoemergente,aluladapelomodelo,orrespondeasaída(problemadireto).

Já paraarede,aradiaçãoemergente passaaseraentradaeovalorde

C

passa a

serasaída(problemainverso).

3

Adiferençanotamanhodopassonadisretizaçãoédevidoavariaçãosigniativadarazão

(9)

5.2. Treinamento da Rede

Como se está utilizando dados sintétios para treinar a rede, é neessário que os

valoresdaradiaçãoretornadospeloproblemadireto,sejamorrompidosomruído,

= 20%

. Emseguida,ospadrõesdo

onjunto de treinamento são oloadosem ordemaleatória e,então, divididosem

três grupos(

G

1

,

G

2

e

G

G

3

. Duranteotreinamentoessesgrupossãoapresentadosàrede.

Oritériode parada adotadoé oda validação ruzada[12℄, sendoque aada

deziteraçõesdafunçãoobjetivooproedimentodetreinamento épausado,etodo

oonjuntodevalidaçãoéapresentadoàredequatrovezes. Naprimeiravez, todos

ospadrõesdoonjuntodevalidaçãosãoorrompidosom

R

1

e,então,apresentados

àrede. Omesmo sedeunasegunda,tereira equartavez,sendoque naúltimaé

utilizadoumnívelderuído

R

4

= 13%

. Este nível, nãopresentenotreinamento,é

utilizadoamdeagregaràredeumamaiorgeneralização.

Cadavezqueoproessodevalidaçãoérealizado,odesempenhodaredeétestado

e sãoarmazenadas asvariáveisdarede, bemomo o número de aertose ovalor

totaldoerrorelativo. Aomdoproesso,aquelasvariáveisqueproduziramomaior

númerodeaertoseomenorerrorelativosãoreuperadaseadotadasomosendo

variáveisótimas.

Para aontagem dasrespostas orretasda rede,adotou-se oritériode que o

valorde

C

estimadopelarededeveestarnointervalo

C

−

R

· C

≤

C

r

_≤

_C

₊

_R

_·

_C

,

em que

R

éonívelderuído nosdadosdeentradae

C

r

éovalor daonentração

delorolaestimado pelarede. Além disso,aredeutilizadaéonstituídade uma

amadadeentradaomdezneurnios,umaamadaoultaom13neurnioseuma

amadadesaídaomapenasumneurnio. Afunçãodeativaçãoutilizadaemtodos

osneurniosdaamada oulta foi afunçãosigmóide

φ

(

v

i

) = 1

/

(1 + exp(

−a

i

v

i

))

e naamadadesaídafoiutilizadaafunçãolinear

φ

(

v

i

) =

a

i

v

i

.

Paraasrestriçõesdenidas naequação(4.4),adotou-se

w

k

min

=

b

l

min

=

w

k

max

=

b

l

max

= 45

, para a restrição (4.2), adotou-se

a

ℓ

max

= 20

e, por m, para a

restri-ção denida pela equação(4.3), adotou-se

a

ℓ

min

=

a

ℓ

max

= 20

. Essesvaloresforam

determinados duranteotreinamentoatravésdeexperimentos, esãoapazes de

re-presentaruma regiãodoespaçodebusanoqualépossívelobterboasrespostas.

6. Resultados

Na resolução do problema, foram onsiderados ino valores para

λ

= 500

,

550 ,

600 ,

650 ,

700

nm, no entanto, poronveniênia, são apresentados apenas os

resul-tados orrespondentes à

λ

= 600

nm. Para

λ

= 500

nm, os resultados foram

ex-tremamente pobres enão expressaramnenhuma onança,e para

λ

= 550

nm, os

resultadosmelhoraramumpouo,noentanto,ataxadeaertoouabaixode71%.

Apesardeomprimentos deonda

λ >

600

nmapresentarembonsresultados,estes

(10)

pouosmetros.

Adiuldadenaobtençãodebonsresultadosparaomprimentosdeondaabaixo

de

λ

= 600

nmpodeseranalisadonaFigura1. AFigura1(a)mostra queháuma

separação entre adaurvaderadiação atéaproximadamente

C

= 3

e,apósesse

valor, asurvas deradiaçãopratiamentesesobrepõe. Poroutrolado,essa

sobre-posição não oorre na Figura 1(b), na qual é possível observar que as urvasda

radiaçãoparaadavalorde

C

onsideradosãodistintas.

−1.000

−0.981

−0.924

−0.831

−0.707

0.0019

0.0129

0.0239

0.0349

0.0458

0.0568

0.0678

Direções Emergentes Consideradas

Intesidade da Radiância Emergente

Amostra do Conjunto de Treinamento sem Ruído

C

0 =0.01

C

0 =1.0

C

0 =10.0

(a)

−1.000

−0.981

−0.924

−0.831

−0.707

0.0002

0.0069

0.0136

0.0203

0.0270

0.0337

0.0404

Direções Emergentes Consideradas

Intesidade da Radiância Emergente

Amostra do Conjunto de Treinamento sem Ruído

C

0 =0.01

C

0 =1.0

C

0 =10.0

(b)

Figura 1: Radiação emergente na superfíie, sem a adição de ruído, para alguns

valoresde

C

,paradoisomprimentosdeonda: (a)

λ

= 500

nm;(b)

λ

= 600

nm.

Umaanálisequantitativaaeradasensibilidade daradiaçãoemergente oma

variaçãodaonentraçãodelorolaéapresentadanaTabela 2. Nessa tabelasão

apresentadososresultadosobtidosatravésdaexpressão 4

∆

I

i

≡

N

µ

X

k

=0

[

I

(0

, µ

k

,

0

◦

, C

+

δC

)

−

I

(0

, µ

k

,

0

◦

, C

)]

2

,

i

= 1

, . . .

9 ,

(6.1)

em que

δC

= 1

. Como é possível observarpelos resultados, a variação

∆

I

para

λ

= 600

émaioremaissigniativaquandoomparadaavariação

∆

I

para

λ

= 500

.

A não sobreposição das urvas apresentadas na Figura 1(b), ou então, a maior

sensibilidade daradiaçãoemergente omavariaçãodaonentraçãodelorolaé

ofatorfundamentalqueontribuiparaamelhoranodesempenhodarede.

NaTabela 3,sãoapresentados, paraadanívelde ruídoonsideradoepara os

problemasassoiadosaosomprimentosdeonda

λ

= 500

,

550

e

600

nm,astaxasde

aerto(

T A

)eoserrosquadrátiosmédios(

EQM

),aluladospelaexpressão

EQM

=

v

u

t

1 N

p

N

p

X

i

=1

(

chl

e

i

−

chl

n

i

)

2

,

onde

N

p

éonúmerototaldepadrõesnoonjuntode validação,e

chl

e

i

e

chl

n

i

são,

respetivamente,asonentraçõesdelorolaexataseestimadas pela redeneural,

4

(11)

Tabela 2: Soma das diferenças quadrátias expressa pelo equação (6.1) para as

sobreoonjuntodevalidação. Valeenfatizarque,omoosníveisderuídodenem

asfaixasdeaertos,paraointervaloomruídode10%onsidera-seomoaeitáveis

valoresdeinversãoomdesviodeaté10%,diferentementedafaixade5%deruído

ondesóseonsideraaeitávelinversõesomdesviomáximode5%. Assimépossível

enontrarmaisaertosemexperimentosommaiornívelderuído(verTabela3).

Tabela3: Taxasdeaerto(

T A

),em%,eerrosquadrátiomédios(

EQM

)sobre o

onjunto devalidação paraadanívelderuído.

λ

NíveldeRuído (%)

5 10 15 20

Ac

EQM

Ac

EQM

Ac

EQM

Ac

EQM

500 19.7 1.00 31.9 1.55 33.3 1.79 35.7 2.37

550 50.7 0.38 67.2 0.64 70.8 0.76 70.4 1.13

600 83.0 0.21 87.3 0.37 90.2 0.43 91.4 0.66

OmenorvalordeEQM,mostradonestatabela,omplementaaanáliseeajuda

ademonstrarqueosmelhoresresultadossãoosgeradosom

λ

= 600

nm. Esta

me-lhoraestáassoiadaàdistânia(separação)queexisteentreadaurvadaFig.1(b).

Estaseparaçãoevitaaonfusãodarededuranteaassoiaçãodopadrãodeentrada

aoverdadeiropadrãodesaída.

A Figura 2 mostra ospers de lorolaobtidos pela rede para o onjunto de

validação, para ada um dosníveis de ruído onsiderados. Oeixo dasordenados

representa asonentraçõesdelorolae oeixo dasabsissas representaadaum

dospadrõesdoonjuntodevalidação.Nasguras,aslinhastraejadasrepresentam

olimitedeerronaestimativade

C

pela rede. A linhaheiarepresentaadaperl

reuperado. Optou-sepeladivisãodosgráosamdemelhoraravisualizaçãodos

resultados,prinipalmenteparabaixasonentraçõesde

C

.

7. Conlusões

Autilização doparâmetrodasfunçõesde ativaçãoajustáveiséuma téniapouo

abordadanaliteratura,esuautilizaçãotemsemostradoeiente,poisada

(12)

1

51

100

150

200 −0.05

0.38

0.81

1.24

1.67

2.10 Dados com 5% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

200

300

400

500

600

700

800

900 1000

1.90

3.62

5.34

7.06

8.78

10.50 Dados com 5% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

(a)

1

51

100

150

200 −0.05

0.40

0.85

1.30

1.75

2.20 Dados com 10% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

200

300

400

500

600

700

800

900 1000

1.80

3.64

5.48

7.32

9.16

11.00 Dados com 10% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

(b)

1

51

100

150

200 −0.05

0.42

0.89

1.37

1.84

2.31 Dados com 13% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

200

300

400

500

600

700

800

900 1000

1.74

3.65

5.57

7.48

9.39

11.31 Dados com 13% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

()

1

51

100

150

200 −0.06

0.45

0.96

1.47

1.98

2.48 Dados com 20% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

200

300

400

500

600

700

800

900 1000

1.49

3.60

5.70

7.80

9.90

12.00 Dados com 20% de ruído

Padrões

Concentração Recuperada

Exa

Est

±

Exa

(d)

Figura2:Persmédiosreuperadosparadadosdeentradageradosom

λ

= 600

nm,

orrompidosomdiferentesníveisderuído: (a)5%;(b)10%;()13%;(d)20%.

Umtreinamento eiente (debaixo usto omputaional), juntamente om os

bonsresultadosobtidos,mostramqueaRNAéumaténiapromissoranaresolução

deproblemasinversosemótiahidrológia.

Fótonsom omprimento de ondaaima de 650 nmtem baixa penetraçãono

orpo de água (são absorvidos em até 5 m). A radiânia para fótons abaixo de

550nm,paradiferentesonentraçõesdelorola,olapsamemumamesmaurva

(verFigura1(a)).Amdegarantirumaertapenetraçãodaradiação,omdistintas

urvasderadiâniasparadiferentesonentraçõesdelorolaadotou-seointervalo

[550nm,650nm℄.

Oparágrafoaimailustraadiuldadeintrínseadaestimativadepropriedades

ótias em águas naturais. A diuldade apontada para o omprimento de onda

λ

= 500

nmestáassoiado aoolapso,ouainda,abaixa sensibilidadedaradiação

emergenteomaonentraçãodelorola. Estaéumarestriçãoassoiadaàfísia

do problema e não da metodologia de inversão. Para redes neurais, várias

on-guraçõesediferentesvaloresiniiais paraasvariáveisforamutilizadas,sendoque,

em nenhumadessas situações, foipossívelmelhorarosresultadosapresentadosna

Tabela3. Já,para oproblemanoqualfoionsiderado

λ

= 600

nm,oaprendizado

da redesedeu de forma rápida,sendo pouo sensívelao númerode neurniosna

(13)

ofatordedeaimentoexponenialdaradiação(efeitodaabsorção)[22℄.

Abstrat. Inthisworktheaverageproleofhlorophyllonentrationisestimated

from the emitted radiation at the surfae of natural waters. This is performed

throughtheuseanArtiialNeuralNetworkofMultilayerPereptrontypetoat

as the inverse operator. Bio-optialmodels are used to orrelate thehlorophyll

onentrationwiththeabsorptionandsatteringoeients. Thenetworktraining

isformulatedasanoptimizationproblem,inwhihtheupdateofthefreevariables

ofnetwork(weights,viésesandeahslopeoftheativationfuntions)isperformed

throughthequasi-Newtonmethod.

Keywords. Multilayerpereptron,quasi-Newtonmethod,hlorophyll

onentra-tion,radiativetransferequation.

Referênias

[1℄ E.S. Chalhoub, O Método dasOrdenadas Disretas na Solução da Equação

deTransporteemGeometriaPlanaomDependêniaAzimutal,Tesede

Dou-torado,IPEN,USP,SãoPaulo,SP,1997.

[2℄ E.S.Chalhoub,Disrete-ordinatessolutionforunoupledmulti-wavelength

ra-diativetransferproblems,J. Quant.Spe. Rad.Trans.,92(2005),335349.

[3℄ E.S.Chalhoub,H.F.CamposVelho,R.D.M.Garia,M.T.Vilhena,A

ompari-sonofradianesgeneratedbyseletedmethodsofsolvingtheradiative-transfer

equation,Trans.Theory Stat.Phys.,32,No.5-7(2003),473503.

[4℄ S.Chandrasekhar,RadiativeTransfer,DoverPubliations,NewYork,1950.

[5℄ F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, Comparison of two

le-arningstrategiesforasupervisedneuralnetwork,em 1stInternational

Sym-posium onUnertaintyQuantiationandStohastiModeling.Unertainties

2012,366380,2012.

[6℄ F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, A ommittee of MLP

with adaptiveslopeparameter trainedbythe quasi-Newton method to solve

problems in hydrologi optis, em IEEE International Joint Conferene on

NeuralNetworks.IJCNN 2012.(IEEE WorldCongressonComputational

In-teligene),21592166,2012.

[7℄ F. Dall Cortivo, E.S. Chalhoub, J.D.S. Silva, H.F. Campos Velho,

Estima-tivado albedodeespalhamento simplesusandouma redeneuraldemúltiplas

amadas,emAnaisdoXXXIII CNMAC,411417,SBMAC,2010.

[8℄ J.E.Dennis,J.J.Moré,Quasi-Newtonmethods,motivationandtheory,SIAM

Review,19,No.1(1977),4689.

(14)

[10℄ H.R.Gordon,A.Y.Morel,RemoteAssessmentofOeanColorfor

Interpreta-tionofSatelliteVisibleImagery,AReview,Springer-Verlag,NewYork,1983.

[11℄ L. Gross, S. Thiria, R. Frouin, B.G. Mithell, Artiial neural networks for

modelingthetransferfuntion betweenmarinereetaneandphytoplankton

pigmentonentration,J. Geophys. Res.,105,No.C2(2000),34833495.

[12℄ S.Haykin,RedesNeurais,Bookman,PortoAlegre,2001.

[13℄ S. Helmut, R. Doerer, Neural network for emulation of an inverse model

operationalderivation of CaseII water properties from MERIS data, Int. J.

Rem.Sens.,20, No.9(1999),17351746.

[14℄ L.E.Keiner,C.W.Brown,Estimatingoeanihlorophyllonentrationswith

neuralnetworks,Int.J. Rem.Sens.,20,No.1(1999),189194.

[15℄ C.D.Mobley,LightandWater,AademiPress,California,1994.

[16℄ A.Y.Morel,Lightandmarinephotosynthesis: aspetralmodelwith

geohemi-alandlimatologialimpliations,Prog.Oeanogr.,26,No.3(1991),263306.

[17℄ A.Y.Morel,L.Prieur,Analysisofvariationsinoeanolor,Limnol.Oeanogr.,

22,No.4(1977),709722.

[18℄ NAG,FortranLibraryManual,NumerialAlgorithmsGroup,Oxford,1995.

[19℄ R.C.Oliveira, N.I.A. Aevedo,A.J. SilvaNeto, L.BiondiNeto, Apliaçãode

umomitêderedesneuraisartiiaisparaasoluçãodeproblemasinversosem

TransferêniaRadiativa,TEMATend.Mat.Apl.Comput.,11,No.2(2010),

171182.

[20℄ L. Prieur, S. Sathyendranath, An optial lassiation of oastal and

oea-ni waters based onthe spei spetralabsorption urvesof phytoplankton

pigments, dissolved organi matter, and other partiulate materials, Limnol.

Oeanogr.,26, No.4(1981),671689.

[21℄ R.P.Souto,ReuperaçãodePersVertiaisdePropriedade ÓtiasInerentes

apartir daRadiação Emergente da Água,Tese de Doutorado, CAP, INPE,

SãoJosédosCampos,SP, 2006.

[22℄ R.P. Souto, H.F. Campos Velho, S. Stephany, Reonstrution of hlorophyll

vertial proles from in-situ radianes using the ant olony meta-heuristi,

IberianLatinamerianCongressonComputationalMethods, AnaisdoXXV

CILAMCE,2004.1,Reife(PE),Brasil(2004).

[23℄ R.P. Souto, H.F. Campos Velho, S. Stephany, M. Kampel, Chlorophyll

on-entrationprolesfrominsituradianesbyantolonyoptimization,J. Phys.: