Uma Publiação daSoiedade BrasileiradeMatemátiaApliadaeComputaional.
Estimativa do Perl da Conentração de Clorola
em Águas Naturais Através de um Pereptron de
Múltiplas Camadas
1
F. DALL CORTIVO 2
, Programa de Pós-Graduação em Computação Apliada,
CAP,InstitutoNaionaldePesquisasEspaiais,INPE,Av. dosAstronautas,1758,
12227-010SãoJosédoCampos,SP, Brasil.
E.S. CHALHOUB, H.F. CAMPOS VELHO, Laboratório Assoiado de
Compu-tação e Matemátia Apliada, LAC, Instituto Naional de Pesquisas Espaiais,
INPE,Av. dosAstronautas,1758,12227-010São JosédoCampos,SP,Brasil.
Resumo. Estimativadoperldeonentraçãodelorola, emáguasnaturais,a
partirdaradiaçãoemergentenasuperfíiedeumorpod'água,omousoderede
neuralartiialdotipoPereptrondeMúltiplasCamadas. Aonentraçãode
lo-rolaestárelaionadaomosoeientesdeabsorçãoeespalhamentoviamodelos
bio-óptios. Otreinamentodaredeéformuladoomoumproblemadeotimização,
noqualaatualizaçãodasvariáveislivresdarede(pesos,viéseparâmetrosdeada
função deativação)éfeitaatravésdométodoquasi-Newton.
Palavras-have. Pereptrondemúltiplas Camadas, métodoquasi-Newton,
on-entraçãodelorola,equaçãodetransferêniaradiativa.
1. Introdução
Neste trabalho a interação de um feixe de fótons om um orpo d'água é
repre-sentada pela Equação de Transferênia Radiativa (ETR). Dadas as ondições de
ontorno, o termo fonte e as propriedades ótias inerentes, é possível resolver a
ETRe,assim,determinaraquantidadedepartíulas(fótons)queestãoemergindo
nasuperfíieda águaapósainteraçãoom omeio. Aoabordar oproblemadessa
forma, arateriza-seoqueéhamadodeproblemadireto. Oorrespondente
pro-blemainversoonsisteemdeterminarumaoumaispropriedadesfísias(fontes
inter-nas,ondiçõesdeontorno,propriedadesótias)apartirdasmedidasradiométrias
(radiânias) emergentes e/ou do interior do orpo d'água. A resolução numéria
da ETR érealizada om oódigoPEESNA [3℄, oqual implementa ométodo
S
N
analítio(AS
N
)[1℄.1
AgradeçoaCAPESpeloauxilionaneirodurantearealizaçãododoutorado.
2
Nomenlatura
θ
ângulopolarrad
I
(
τ, µ, ϕ, λ
)
radiâniacd
τ
variávelótiadeprofundidadeµ
o-senodoângulo polar (cos
θ
)medido apartirdoeixopositivo
τ
ϕ
ânguloazimutalrad
λ
omprimentodeondanm
ζ
profundidadeótiaΘ
ângulo de espalhamento formado pelas direções{µ
′
, ϕ
′
}
e
{µ, ϕ}
rad
b
(
τ, λ
)
oeientedeespalhamentom
−
1
a
(
τ, λ
)
oeientedeabsorçãom
−
1
c
(
τ, λ
)
oeientedeatenuaçãom
−
1
p
(cos Θ
, λ
)
funãodefasedeespalhamentoS
0
(
τ, λ
)
fonteinternaderadiaçãocd
I
0
radiâniainidente nasuperfíiecd
µ
0
o-senodoângulopolardeinidêniaϕ
0
ânguloazimutaldeinidêniarad
δ
(
·
)
funçãodelta deDiraI
s
(
τ, µ, ϕ
)
omponente deradiâniaespalhadacd
I
u
(
τ, µ, ϕ
)
omponente deradiânianão-espalhadacd
L
ordemdeespalhamentoC
(
τ
)
onentraçãodelorolamg
·
m
−
3
a
w
λ
oeientedeabsorçãodaáguapuram
−
1
a
c
λ
oeientedeabsorçãoespeíodaC
(
τ
)
b
(
τ, λ
)
oeientedeespalhamentodaáguapuram
−
1
x
j
entradaj
deumvetordepadrõesw
ji
pesosináptio queliga aentradaj
aoneurnioi
b
i
viésdoneurnioi
φ
funçãodeativaçãov
i
ampoloalinduzidodoneurnioi
a
oeientequeindiaainlinaçãodafunçãodeati-vação
E
t
matrizqueontemtodosospadrõesdeentradaparaotreinamento
W
matrizqueontemtodosospesossináptiosB
matriz/vetorqueontemtodososviésA
matrizqueontemtodososoeientesqueindiamainlinaçãodasfunçõesdeativação
M
númerototaldeneurniosnaamadadesaídaT
númerototaldepadrõesdetreinamentoO
t
ij
entradaij
da matriz de padrões de saída para otreinamento
a
ℓ
∗
valormáximo/mínimoqueooeientedeinlina-çãodasfunçõesdeativaçãopodeatingir
w
k
∗
valor máximo/mínimoqueos pesos sináptiospo-dematingir
b
l
∗
valormáximo/mínimoqueosviéspodem atingirX
X
X
vetorontendow, b
ea
iniiais∇
operadorgradienteH
−
1
matrizHessianainversa
R
nívelderuídoG
grupodepadrõesT A
taxadeaertoN
µ
númerodedireçõesdisretasonsideradasparame-diçãodaradiaçãoemergente
EQM
erroquadrátiomédioN
p
númerototaldepadrõesnoonjuntodevalidaçãochl
e
i
onentraçãodelorolaexatamg
·
m
−
3
chl
e
n
onentraçãodelorolaestimada pelaredemg
·
m
−
3
Oproblemainversopodeserformuladoomoumproblemadeotimização,
bus-andosoluçõesregularizadas. Essaabordagem,hamadadeimplíita,foi utilizada
para resolver problemas, nos quais se desejou estimar pers vertiais da
onen-tração de lorola [21℄. Apesar dos bons resultados obtidos, a omplexidade do
problemainverso/diretofezneessárioautilização deproessamentoparalelopara
a resolução [21, 23℄. A resolução de ótia hidrológia inversa por esta estratégia
requer enorme usto omputaional. Gordon [9℄ faz uma revisão de ténias de
soluçãoem váriosproblemasinversosemÓtiaHidrológia.
Uma estratégia para reduzir o tempo omputaional na resolução deste tipo
de problemainversoé autilização de RedesNeuraisArtiiais(RNAs) [7, 19, 5℄,
devidoaapaidadeintrínseadesses sistemasemaproximarfunções[12℄.
Estimativasdaonentraçãodeloroladesuperfíieemáguasnaturais(além
de outraspropriedades), apartirda reetâniamedida porsatélites,já temsido
realizadasatravésdeRNAs[14,13,11℄. Nessestrabalhos,ospadrõesdeentradada
redesãoformadospelas reetâniasmedidas nasbandas(omprimentosdeonda)
dovisível, sendoqueovalor médio deada bandaorrespondeauma entradada
rede. Emnossoestudo,ospadrõesdeentradaneessáriospara treinar evalidara
redesãoformadospelaradiação(radiânia)emergentenasuperfíie,sendoqueada
direção(polar)disretaonsideradaorrespondeaumaentradadarede. Ométodo
deinversãobaseadoemRNAserátestadoommedidasderadiâniassintétias,em
queradiâniassãoaluladasapartirdasoluçãodaETR(problemadireto). Para
osoeientesdeabsorçãoeespalhamento,sãoempregadosmodelosbio-óptios[16,
10℄, nosquaisestes oeientes sãodadosem funçãodaonentraçãodelorola.
A soluçãoinversaé obtidaatravésde uma RNA dotipoPereptronde Múltiplas
Camadas(MLP).Otreinamentodaredeéfeitoatravésdaminimizaçãodofunional
de diferença quadrátia entre as respostas dadas pela rede os padrões de saída
inlui,alémdepesoseviés,oparâmetrodasfunçõesdeativação.
2. Formulação do Problema Direto
AETRéummodelomatemátioutilizadopararepresentarainteraçãodeumfeixe
deluz(fótons)omumorpod'água. Emmuitasapliações,prinipalmenteaquelas
queenvolvemoestudodainteraçãodessefeixedeluzomáguasoeânias,é
plau-sívelonsiderarque oorpod'água apresente variaçõessigniativas,omrelação
aosseusonstituintes,apenasomaprofundidade. Nesteaso,denomina-seoque
éhamadode geometriaplano-paralela. A ETRpara estetipodegeometria, om
dependêniaespetral,azimutalepolar,eespalhamentoanisotrópioédadapor
µ
∂
∂τ
I
(
τ, µ, ϕ, λ
) +
I
(
τ, µ, ϕ, λ
) =
b
(
τ, λ
)
c
(
τ, λ
)
Z
1
−
1
Z
2
π
0
Z
λ
p
(cos Θ
, λ
)
I
(
τ, µ
′
, ϕ
′
, λ
′
)
dλ
′
dϕ
′
dµ
′
+
S
0
(
τ, λ
)
,
(2.1)em que
I
(
τ, µ, ϕ, λ
)
representa a intensidade do feixe de radiação,τ
∈
(0
, ζ
)
, avariável ótia, no qual
ζ
é a espessura ótia do meio,µ
∈
[
−
1
,
1]
,ϕ
∈
[0
,
2
π
]
e,representam, respetivamente, oo-senodo ângulo polar medido a partirdo eixo
positivo
τ
e o ângulo azimutal, os quais espeiam a direção de propagaçãoΘ
da radiaçãono meio e
λ
éo omprimento de ondado fóton. Otermob
(
τ, λ
)
é ooeiente deespalhamento,
c
(
τ, λ
) =
a
(
τ, λ
) +
b
(
τ, λ
)
éooeiente deatenuaçãodo feixe em que
a
(
τ, λ
)
é ooeiente de absorção. Porm, o termop
(cos Θ
, λ
)
é hamado de função de fase, e representa o espalhamento de um feixe inidente
nadireção
{µ
′
, ϕ
′
, λ}
aserespalhadonadireção
{µ, ϕ, λ}
,eS
0
(
τ, λ
)
éuma fonteinterna deradiação. Asondiçõesdeontorno, assoiadasao problemaabordado,
sãodadaspor
I
(0
, µ, ϕ, λ
) =
I
0
δ
(
µ
−
µ
0
)
δ
(
ϕ
−
ϕ
0
)
eI
(
ζ,
−µ, ϕ, λ
) = 0
,
(2.2)emquee
I
0
éaradiâniainidentenasuperfíie,µ
0
éoossenodoângulopolardeinidênia,
ϕ
0
éoânguloazimutaldeinidêniaeδ
(
·
)
éafunçãodeltadeDira.Pararesolveroproblemadenidopelaequação(2.1),sujeitaàsondiçõesdadas
pelas equações (2.2), efetua-se uma disretização espaial eespetral[2℄. Há um
desaoplamentopara adaomprimentode ondae aquiadependêniado
ompri-mentodeondaserátomadoumvalormédio,isto é,
I
λ
(
τ, µ, ϕ
) =
1
∆
λ
Z
λ
+∆
λ
λ
I
(
τ, µ, ϕ, λ
)
dλ.
A m de simpliar a notação não será grifado a dependênia do omprimento
de onda
λ
. Opróximopasso onsiste em realizaradeomposição da intensidadede radiação
I
(
τ, µ, ϕ
)
[4℄ em omponentes espalhadaI
s
(
τ, µ, ϕ
)
e não-espalhadaI
u
(
τ, µ, ϕ
)
e, dessa forma, asoluçãoI
(
τ, µ, ϕ
)
passa a serexpressa omo sendo asomadessasomponentes,
Paraobterasoluçãoparaaomponentenão-espalhada,onsidera-se
b
(
τ, λ
) = 0
naequação (2.1), sujeitoàs ondições(2.2)e, então, resolve-seaequação
diferen-ial parial resultante. Já para a omponente espalhada
I
s
(
τ, µ, ϕ
)
, iniialmente aproxima-seafunçãodefasedeHenyey-Greenstein[15℄emumasérienitadefun-çõesdeLegendreassoiadas,eemseguidautiliza-seadeomposiçãodeFourierem
o-senos [4℄, sobre o ângulo azimutal, de modo a gerar
L
+ 1
equaçõesintegro-diferenias (ETRs), sem a dependênia de
ϕ
. Otermo integral presente em adaequaçãoíntegro-diferenialéaproximadopelométododaoloação,oqualonsiste
emsubstituiraintegralangularporumesquemadequadraturadeGauss-Legendre.
Essaaproximaçãoproduzumonjuntode
N
equaçõesdifereniaisordináriasdepri-meiraordempara adaânguloazimutal. Asoluçãoanalítia,paraadaumdesses
onjuntos,éobtidaatravésdométodo
AS
N
,queébaseadonadeomposição espe-traldamatrizdeespalhamento. ParaaaproximaçãonumériaéutilizadooódigoPEESNA[3℄,oqualimplementaométodo
AS
N
.Arelaçãoentre osoeientesdeabsorçãoeespalhamentoomaonentração
delorolaéfeitaatravésdemodelosbio-óptios. Segundo[16℄e[10℄,asexpressões
que relaionam a onentração de lorola om aabsorção e o espalhamento são
dadas,respetivamente,por
a
(
τ, λ
) =
a
w
λ
+ 0
.
06
a
c
λ
C
0
.
65
(
τ
)
h
1 + 0
.
2
e
−
0
.
014(
λ
−
440)
i
,
e
b
(
τ, λ
) =
b
w
λ
+
550
λ
0
.
3
C
0
.
62
(
τ
)
,
emque
a
w
λ
eb
w
λ
são,respetivamente,ooeientedeabsorçãoeespalhamentodaáguapura,ujosvalorespodemserenontradosem[17℄,
λ
representaoomprimentodeonda,
a
c
λ
éumoeientedeabsorçãoespeíodaonentraçãodelorola,ujovalorpodeserenontradoem[20℄,e
C
(
τ
)
éaonentraçãodelorola,aqual,parao presente trabalho, é onsiderada onstante. Por m, mais detalhes aera da
soluçãopara oproblemadenidonessaseçãopodemserenontradosem[2℄.
3. Pereptron de Múltiplas Camadas
Um MLP é obtido através da onexão de vários neurnios entre si, de modo a
formaremuma rede. Essa redeéonstituída deuma amada deentrada, umaou
maisamadasoultas,eumaamadadesaída. Nessemodeloderede,ainformação
épassadaadianteamadaporamadaatéatingiraamadadesaída. Ainformação
quehegaemadaumadasunidadesdeproessamentoequedeveráserproessada
poressasunidades,édenidamatematiamentepor
v
i
=
P
j
w
ji
x
j
+
b
i
,emquex
j
representaasinformaçõesdeentrada,
w
ji
asonexõesentreosneurnios(sinapses), eb
i
éhamadodeníveldeviés,epodeserinterpretadoomoumvalorqueéajustado a m de omplementar alguma atividade presente no neurnio biológio, masnão presente no neurnioartiial. Essainformaçãoéproessadaatravésde uma
funçãode ativação
φ
, aqual tempornalidade restringir aamplitudedo sinaldetangentehiperbóliaeafunçãolinear,denidas,respetivamente,por
φ
(
v
) =
1
1 +
e
−
av
,
a >
0
,
φ
(
v
) =
1
−
e
−
av
1 +
e
−
av
,
a >
0
eφ
(
v
) =
av,
a
∈ R
∗
.
RedesdotipoMLPsrequeremumtreinamentodotiposupervisionado,ouseja,
oma presençade umprofessor que temo onheimento doambiente quea rede
deverá aprender. Esse ambiente é representado por um onjunto de entradas e
saídasonheidas. Duranteafasedeaprendizagem,oprofessorapresentauma
de-terminada entrada à rede, que por sua vez proessa a informação apresentada e
devolveumasaída. Asaídaaluladapelaredeéomparadaomasaídadesejada,
eomissoégeradoumsinaldeerro, oqualépropagadoparatrás
(retropropaga-ção)atravésdo algoritmode treinamento. Durante a retropropagaçãodo erro, o
algoritmodetreinamento,baseadoemalgumaregra,fazumaorreçãonasvariáveis
livres da rede de modo a orrigir os valoresdos seus parâmetros livres, a m de
minimizar oerro ometido. Dessa forma, espera-se que a redeaprenda afazer a
orretaassoiaçãoentre ospadrõesdeentradaeospadrõesdesaída.
4. Formulação do Problema Inverso
Aformulaçãoparaotreinamento,desritaabaixo,segueaadotadaem[6℄,enessa
formulação,otreinamento ésupervisionadoedotipobath [12℄.
Para otreinamento, foi denido umfunional
J
(
·
)
que édadopela somadasdiferençasquadrátiasentreospadrõesdesaídautilizados paraotreinamentoeas
respostasobtidaspela redepara adapadrãode entrada,e paraoqual busou-se
umvalormínimo,ouseja,
J
(
E
t
,
W
,
B
,
A
) = min
T
X
j
=1
M
X
i
=1
O
t
ij
−
O
n
ij
2
2
,
(4.1)em que
E
t
,W
,B
eA
são matrizes que ontem, respetivamente, os padrões de entrada para o treinamento, os pesos sináptios, os biases e os parâmetros dasfunções de ativação. Já
M
representa o número total de neurnios na amadade saída,
T
representa o número total de padrões de treinamento,O
t
ij
eO
n
ij
representam,respetivamente,adaentradadasmatrizesqueontemospadrõesde
saídaparaotreinamentoeassaídasaluladaspelarede. Outrosdetalhesem[6℄.
Note que é neessário inluir restrições às variáveis que estão sendo
otimiza-das,espeialmenteàsrelaionadasomoparâmetrodasfunçõesdeativação. Pela
denição dasfunçõessigmóideetangentehiperbólia,estesparâmetrosdevem ser
positivose,portanto,osvaloresótimos paraessesparâmetrosdevemsatisfazer
0
< a
ℓ
≤
a
ℓ
max
,
(4.2)
em que
a
ℓ
max
é umvalor máximopré-denido,am deevitar queeste parâmetro
exponen-linear,arestriçãodadapelaequação(4.2)podesersubstituídapor
−a
ℓ
min
≤
a
ℓ
≤
a
ℓ
max
,
a
ℓ
6
= 0
,
(4.3)
emque
a
ℓ
min e
a
ℓ
max
sãovaloresmínimosemáximos,respetivamente,pré-denidos
amdeevitarumoverow.
Otreinamentodaredepodeenvolverumafunçãoommúltiplosmínimosloais,
o quetorna difíil garantir que seráenontrado um mínimoglobal. Diante disso,
pareeseratraenteaidéiadereduziroespaçodebusae,então,busarporum
mí-nimoloaldentrodessesub-espaçogerado,desdequeesseproduzabonsresultados.
Areduçãodoespaçodebusaéobtidooloandorestriçõesnasdemaisvariáveisa
serem otimizadas, ouseja, nos pesos enos viés. Portanto, durante o proessode
treinamento sãobusadosvaloresparaamatriz
W
eparamatriz/vetorB
demodoqueestessatisfaçamasrestrições
−w
k
min
≤
w
k
≤
w
k
max
−b
l
min
≤
b
l
≤
b
l
max
,
(4.4)em que
w
k
∗
está assoiado às restrições aos pesos,b
l
∗
está assoiado às restriçõesaos viés. Outra vantagem que surge om a inlusão dessas restrições nos pesos
e viés, é o fato que é possível evitar que esses parâmetros assumam ordens de
grandezaelevadase,assim,evitarasaturaçãodosneurnios,fatoessenãodesejado
poisprejudiaotreinamento. Portanto, durante otreinamentoda rede,ométodo
utilizadobusa um mínimo parao funional denido naequação (4.1), sujeito às
ondiçõesexpressaspelasequações(4.2)e/ou(4.3)e/ou(4.4).
Nestetrabalho,paraaminimizaçãodofunionaldenidonaequação(4.1),é
uti-lizado ométodoquasi-Newtonimplementadonasub-rotinaE04UCFdabibliotea
NAG, desenvolvidapor Numerial Algorithms Group NAG [18℄. Optou-se pela
utilização da bibliotea itada em função da robustez da mesma para soluçãode
problemasdeotimizaçãonão-lineares,epelapossibilidadedainlusãodasrestrições
omentadasanteriormente,ver[5,6℄.
Para o treinamento, as variáveis a serem otimizadas (pesos, viés e parâmetro
das funçõesde ativação) são organizadasem umvetor
X
X
X
= [
W B A
]
T
. Durante
esseproesso,abiblioteaproura umvalor
X
X
X
∗
para
X
X
X
,demodoque∇J
(
·
, X
X
X
∗
) = 000
,
(4.5)
eaindalevaemonsideraçãoque
X
X
X
∗
satisfazasondiçõesexpressaspelasequações
(4.2)e/ou(4.3)e/ou(4.4). Agora,se
X
X
X
k
+1
=
X
X
X
k
+ ∆
X
X
X
k
aproximaopontoX
X
X
∗
na
(
k
+ 1)
-ésimaiteração, então, fazendo aaproximação deprimeira ordem em sériedeTaylorparaaequação(4.5) emtornodoponto
X
X
X
k
+1
, obtém-seX
X
X
k
+1
=
X
X
X
k
+
H
−
1
∇J
(
·
, X
X
X
k
)
,emqueH
−
1
éamatrizHessianainversaem
X
X
X
=
X
X
X
k
. Naprátia,a inversaH
−
1
nãoéaluladadeformaexata,esimdeumaformaaproximada. Para
isso, onsidereque
X
X
X
k
é um ponto iniialeH
−
1
k
é uma aproximaçãodaHessianainversa, e que respeita as ondições denidas em [8℄. Então, primeiramente, o
algoritmo alula o gradiente de
J
emX
X
X
k
, em segundo alula uma direção de busadenida pela expressãod
k
=
−
H
−
1
de modo que
X
X
X
k
+1
=
X
X
X
k
+
α
k
d
k
, em queα
k
é o tamanho do passo e, por m, atualizaH
−
1
k
atravésdaexpressãoH
−
1
k
+1
=
H
−
1
k
−
H
−
1
k
S
S
S
k
S
S
S
T
k
H
−
1
k
S
S
S
k
,
H
−
k
1
S
S
S
k
+
S
S
S
k
S
S
S
T
k
hY
Y
Y
k
, S
S
S
k
i
,
emque
S
S
S
k
=
X
X
X
k
+1
−
X
X
X
k
eY
Y
Y
k
=
∇J
(
·, X
X
X
k
+1
)
− ∇J
(
·, X
X
X
k
)
. Detalhesdabibliotea edométodoquasi-Newtonpodem serenontradosem[18℄e[8℄, respetivamente.5. Conjuntos de Treinamento, Validação e T
reina-mento da Rede
Nestaseçãodesreve-seomosãogeradososonjuntosdetreinamentoede
valida-ção. Comooformalismomatemátioparaaformulaçãodoproblemadetreinamento
foi desrito na seção anterior, aqui sãoabordadosapenas osdetalhes do
proedi-mentodetreinamento.
5.1. Conjuntos de Treinamento e Validação
Ambos onjuntos, de treinamento e de validação, utilizados neste trabalho, são
obtidosapartirdaresoluçãodoproblemaexpostonaSeção2.
Paraestetrabalho,adotou-seumaúniaregiãoespaialenessaregião
(profun-didadeótia)onsiderou-sequeoperldaonentraçãodelorola
C
éonstante,ouseja,umvalor médionaregião. A partirdoparâmetro
C
, épossívelresolveroproblemadenidonaquelaseção,determinandoaradiaçãoemergentenasuperfíie
após ainteraçãodessaomomeio,em direções(o-senodo ângulopolar)
esolhi-dasa priori. Sãoesses valoresdaradiação emergenteque onstituirãoospadrões
de entrada para o treinamento e validação/teste da rede. As direções disretas
adotadasorrespondemaumtotaldedezigualmenteespaçadasepertenentesao
intervalo
θ
∈
[90
◦
,
135
◦
]
. Paraoânguloazimutaladotou-se
ϕ
0
= 0
◦
. Comrelação
àonentraçãodelorolaadotou-se
C
∈
[0
.
01
,
10
.
0]
.Para gerar o onjunto de treinamento, esse intervalo foi disretizado omo
C
= [0
.
01
,
0
.
02
,
0
.
03
, . . . ,
0
.
1
,
0
.
15
,
0
.
2
,
0
.
3
,
0
.
4
, . . . ,
9
.
8
,
9
.
9
,
10
.
0]
, gerando 110valoresdisretos 3
. Já parageraroonjuntode validação,adotou-seuma
disreti-zaçãoigualmenteespaçadaomumtamanhodepassode
∆
C
= 0
.
01
,gerando1000 valoresdisretos. Portanto,adapadrãodeentrada(soluçãodoproblemaparaadavalordisreto de
C
)de ambosonjuntos(treinamento evalidação) éompostodedez entradas, e ada padrão de saída é ompostopelo respetivo valor de
C
quegerou o padrão de entrada. Note que onúmero total de padrões no onjunto de
treinamento é110,enoonjunto devalidaçãoé1000.
Porm,valelembrarqueadavalorde
C
orrespondeaumdadodeentrada,earadiaçãoemergente,aluladapelomodelo,orrespondeasaída(problemadireto).
Já paraarede,aradiaçãoemergente passaaseraentradaeovalorde
C
passa aserasaída(problemainverso).
3
Adiferençanotamanhodopassonadisretizaçãoédevidoavariaçãosigniativadarazão
5.2. Treinamento da Rede
Como se está utilizando dados sintétios para treinar a rede, é neessário que os
valoresdaradiaçãoretornadospeloproblemadireto,sejamorrompidosomruído,
amdesimularpossíveiserrosdemedidas. Paraisso,sãoonsideradostrêsníveis
deruído gaussiano:
R
1
= 5%
,R
2
= 10%
eR
3
= 20%
. Emseguida,ospadrõesdoonjunto de treinamento são oloadosem ordemaleatória e,então, divididosem
três grupos(
G
1
,G
2
eG
3
) om a mesma quantidade de padrões em ada grupo.Cada umdesses gruposreebeu umdosníveisde ruído,sendo:
R
1
para oG
1
,R
2
para
G
2
eR
3
paraG
3
. Duranteotreinamentoessesgrupossãoapresentadosàrede.Oritériode parada adotadoé oda validação ruzada[12℄, sendoque aada
deziteraçõesdafunçãoobjetivooproedimentodetreinamento épausado,etodo
oonjuntodevalidaçãoéapresentadoàredequatrovezes. Naprimeiravez, todos
ospadrõesdoonjuntodevalidaçãosãoorrompidosom
R
1
e,então,apresentadosàrede. Omesmo sedeunasegunda,tereira equartavez,sendoque naúltimaé
utilizadoumnívelderuído
R
4
= 13%
. Este nível, nãopresentenotreinamento,éutilizadoamdeagregaràredeumamaiorgeneralização.
Cadavezqueoproessodevalidaçãoérealizado,odesempenhodaredeétestado
e sãoarmazenadas asvariáveisdarede, bemomo o número de aertose ovalor
totaldoerrorelativo. Aomdoproesso,aquelasvariáveisqueproduziramomaior
númerodeaertoseomenorerrorelativosãoreuperadaseadotadasomosendo
variáveisótimas.
Para aontagem dasrespostas orretasda rede,adotou-se oritériode que o
valorde
C
estimadopelarededeveestarnointervaloC
−
R
·
C
≤
C
r
≤
C
+
R
·
C
,
em que
R
éonívelderuído nosdadosdeentradaeC
r
éovalor daonentração
delorolaestimado pelarede. Além disso,aredeutilizadaéonstituídade uma
amadadeentradaomdezneurnios,umaamadaoultaom13neurnioseuma
amadadesaídaomapenasumneurnio. Afunçãodeativaçãoutilizadaemtodos
osneurniosdaamada oulta foi afunçãosigmóide
φ
(
v
i
) = 1
/
(1 + exp(
−a
i
v
i
))
e naamadadesaídafoiutilizadaafunçãolinearφ
(
v
i
) =
a
i
v
i
.Paraasrestriçõesdenidas naequação(4.4),adotou-se
w
k
min
=
b
l
min
=
w
k
max
=
b
l
max
= 45
, para a restrição (4.2), adotou-se
a
ℓ
max
= 20
e, por m, para a
restri-ção denida pela equação(4.3), adotou-se
a
ℓ
min
=
a
ℓ
max
= 20
. Essesvaloresforam
determinados duranteotreinamentoatravésdeexperimentos, esãoapazes de
re-presentaruma regiãodoespaçodebusanoqualépossívelobterboasrespostas.
6. Resultados
Na resolução do problema, foram onsiderados ino valores para
λ
= 500
,
550
,
600
,
650
,
700
nm, no entanto, poronveniênia, são apresentados apenas osresul-tados orrespondentes à
λ
= 600
nm. Paraλ
= 500
nm, os resultados foramex-tremamente pobres enão expressaramnenhuma onança,e para
λ
= 550
nm, osresultadosmelhoraramumpouo,noentanto,ataxadeaertoouabaixode71%.
Apesardeomprimentos deonda
λ >
600
nmapresentarembonsresultados,estespouosmetros.
Adiuldadenaobtençãodebonsresultadosparaomprimentosdeondaabaixo
de
λ
= 600
nmpodeseranalisadonaFigura1. AFigura1(a)mostra queháumaseparação entre adaurvaderadiação atéaproximadamente
C
= 3
e,apósessevalor, asurvas deradiaçãopratiamentesesobrepõe. Poroutrolado,essa
sobre-posição não oorre na Figura 1(b), na qual é possível observar que as urvasda
radiaçãoparaadavalorde
C
onsideradosãodistintas.−1.000
−0.981
−0.924
−0.831
−0.707
0.0019
0.0129
0.0239
0.0349
0.0458
0.0568
0.0678
Direções Emergentes Consideradas
Intesidade da Radiância Emergente
Amostra do Conjunto de Treinamento sem Ruído
C
0
=0.01
C
0
=1.0
C
0
=10.0
(a)
−1.000
−0.981
−0.924
−0.831
−0.707
0.0002
0.0069
0.0136
0.0203
0.0270
0.0337
0.0404
Direções Emergentes Consideradas
Intesidade da Radiância Emergente
Amostra do Conjunto de Treinamento sem Ruído
C
0
=0.01
C
0
=1.0
C
0
=10.0
(b)
Figura 1: Radiação emergente na superfíie, sem a adição de ruído, para alguns
valoresde
C
,paradoisomprimentosdeonda: (a)λ
= 500
nm;(b)λ
= 600
nm.Umaanálisequantitativaaeradasensibilidade daradiaçãoemergente oma
variaçãodaonentraçãodelorolaéapresentadanaTabela 2. Nessa tabelasão
apresentadososresultadosobtidosatravésdaexpressão 4
∆
I
i
≡
N
µ
X
k
=0
[
I
(0
, µ
k
,
0
◦
, C
+
δC
)
−
I
(0
, µ
k
,
0
◦
, C
)]
2
,
i
= 1
, . . .
9
,
(6.1)em que
δC
= 1
. Como é possível observarpelos resultados, a variação∆
I
paraλ
= 600
émaioremaissigniativaquandoomparadaavariação∆
I
paraλ
= 500
.A não sobreposição das urvas apresentadas na Figura 1(b), ou então, a maior
sensibilidade daradiaçãoemergente omavariaçãodaonentraçãodelorolaé
ofatorfundamentalqueontribuiparaamelhoranodesempenhodarede.
NaTabela 3,sãoapresentados, paraadanívelde ruídoonsideradoepara os
problemasassoiadosaosomprimentosdeonda
λ
= 500
,
550
e600
nm,astaxasdeaerto(
T A
)eoserrosquadrátiosmédios(EQM
),aluladospelaexpressãoEQM
=
v
u
u
t
1
N
p
N
p
X
i
=1
(
chl
e
i
−
chl
n
i
)
2
,
onde
N
p
éonúmerototaldepadrõesnoonjuntode validação,echl
e
i
echl
n
i
são,respetivamente,asonentraçõesdelorolaexataseestimadas pela redeneural,
4
Tabela 2: Soma das diferenças quadrátias expressa pelo equação (6.1) para as
radiaçõesemergentesmostradasnasFiguras1(a)e1(b).
λ
= 500
λ
= 600
∆
I
1
0.0375∆
I
6
0.0004∆
I
1
0.0634∆
I
6
0.0146∆
I
2
0.0083∆
I
7
0.0002∆
I
2
0.0399∆
I
7
0.0122∆
I
3
0.0030∆
I
8
0.0002∆
I
3
0.0287∆
I
8
0.0104∆
I
4
0.0013∆
I
9
0.0001∆
I
4
0.0221∆
I
9
0.0090∆
I
5
0.0006∆
I
5
0.0177sobreoonjuntodevalidação. Valeenfatizarque,omoosníveisderuídodenem
asfaixasdeaertos,paraointervaloomruídode10%onsidera-seomoaeitáveis
valoresdeinversãoomdesviodeaté10%,diferentementedafaixade5%deruído
ondesóseonsideraaeitávelinversõesomdesviomáximode5%. Assimépossível
enontrarmaisaertosemexperimentosommaiornívelderuído(verTabela3).
Tabela3: Taxasdeaerto(
T A
),em%,eerrosquadrátiomédios(EQM
)sobre oonjunto devalidação paraadanívelderuído.
λ
NíveldeRuído (%)
5 10 15 20
Ac
EQM
Ac
EQM
Ac
EQM
Ac
EQM
500 19.7 1.00 31.9 1.55 33.3 1.79 35.7 2.37
550 50.7 0.38 67.2 0.64 70.8 0.76 70.4 1.13
600 83.0 0.21 87.3 0.37 90.2 0.43 91.4 0.66
OmenorvalordeEQM,mostradonestatabela,omplementaaanáliseeajuda
ademonstrarqueosmelhoresresultadossãoosgeradosom
λ
= 600
nm. Estame-lhoraestáassoiadaàdistânia(separação)queexisteentreadaurvadaFig.1(b).
Estaseparaçãoevitaaonfusãodarededuranteaassoiaçãodopadrãodeentrada
aoverdadeiropadrãodesaída.
A Figura 2 mostra ospers de lorolaobtidos pela rede para o onjunto de
validação, para ada um dosníveis de ruído onsiderados. Oeixo dasordenados
representa asonentraçõesdelorolae oeixo dasabsissas representaadaum
dospadrõesdoonjuntodevalidação.Nasguras,aslinhastraejadasrepresentam
olimitedeerronaestimativade
C
pela rede. A linhaheiarepresentaadaperlreuperado. Optou-sepeladivisãodosgráosamdemelhoraravisualizaçãodos
resultados,prinipalmenteparabaixasonentraçõesde
C
.7. Conlusões
Autilização doparâmetrodasfunçõesde ativaçãoajustáveiséuma téniapouo
abordadanaliteratura,esuautilizaçãotemsemostradoeiente,poisada
1
51
100
150
200
−0.05
0.38
0.81
1.24
1.67
2.10
Dados com 5% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
200
300
400
500
600
700
800
900
1000
1.90
3.62
5.34
7.06
8.78
10.50
Dados com 5% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
(a)
1
51
100
150
200
−0.05
0.40
0.85
1.30
1.75
2.20
Dados com 10% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
200
300
400
500
600
700
800
900
1000
1.80
3.64
5.48
7.32
9.16
11.00
Dados com 10% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
(b)
1
51
100
150
200
−0.05
0.42
0.89
1.37
1.84
2.31
Dados com 13% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
200
300
400
500
600
700
800
900
1000
1.74
3.65
5.57
7.48
9.39
11.31
Dados com 13% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
()
1
51
100
150
200
−0.06
0.45
0.96
1.47
1.98
2.48
Dados com 20% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
200
300
400
500
600
700
800
900
1000
1.49
3.60
5.70
7.80
9.90
12.00
Dados com 20% de ruído
Padrões
Concentração Recuperada
Exa
Est
±
Exa
(d)
Figura2:Persmédiosreuperadosparadadosdeentradageradosom
λ
= 600
nm,orrompidosomdiferentesníveisderuído: (a)5%;(b)10%;()13%;(d)20%.
Umtreinamento eiente (debaixo usto omputaional), juntamente om os
bonsresultadosobtidos,mostramqueaRNAéumaténiapromissoranaresolução
deproblemasinversosemótiahidrológia.
Fótonsom omprimento de ondaaima de 650 nmtem baixa penetraçãono
orpo de água (são absorvidos em até 5 m). A radiânia para fótons abaixo de
550nm,paradiferentesonentraçõesdelorola,olapsamemumamesmaurva
(verFigura1(a)).Amdegarantirumaertapenetraçãodaradiação,omdistintas
urvasderadiâniasparadiferentesonentraçõesdelorolaadotou-seointervalo
[550nm,650nm℄.
Oparágrafoaimailustraadiuldadeintrínseadaestimativadepropriedades
ótias em águas naturais. A diuldade apontada para o omprimento de onda
λ
= 500
nmestáassoiado aoolapso,ouainda,abaixa sensibilidadedaradiaçãoemergenteomaonentraçãodelorola. Estaéumarestriçãoassoiadaàfísia
do problema e não da metodologia de inversão. Para redes neurais, várias
on-guraçõesediferentesvaloresiniiais paraasvariáveisforamutilizadas,sendoque,
em nenhumadessas situações, foipossívelmelhorarosresultadosapresentadosna
Tabela3. Já,para oproblemanoqualfoionsiderado
λ
= 600
nm,oaprendizadoda redesedeu de forma rápida,sendo pouo sensívelao númerode neurniosna
ofatordedeaimentoexponenialdaradiação(efeitodaabsorção)[22℄.
Abstrat. Inthisworktheaverageproleofhlorophyllonentrationisestimated
from the emitted radiation at the surfae of natural waters. This is performed
throughtheuseanArtiialNeuralNetworkofMultilayerPereptrontypetoat
as the inverse operator. Bio-optialmodels are used to orrelate thehlorophyll
onentrationwiththeabsorptionandsatteringoeients. Thenetworktraining
isformulatedasanoptimizationproblem,inwhihtheupdateofthefreevariables
ofnetwork(weights,viésesandeahslopeoftheativationfuntions)isperformed
throughthequasi-Newtonmethod.
Keywords. Multilayerpereptron,quasi-Newtonmethod,hlorophyll
onentra-tion,radiativetransferequation.
Referênias
[1℄ E.S. Chalhoub, O Método dasOrdenadas Disretas na Solução da Equação
deTransporteemGeometriaPlanaomDependêniaAzimutal,Tesede
Dou-torado,IPEN,USP,SãoPaulo,SP,1997.
[2℄ E.S.Chalhoub,Disrete-ordinatessolutionforunoupledmulti-wavelength
ra-diativetransferproblems,J. Quant.Spe. Rad.Trans.,92(2005),335349.
[3℄ E.S.Chalhoub,H.F.CamposVelho,R.D.M.Garia,M.T.Vilhena,A
ompari-sonofradianesgeneratedbyseletedmethodsofsolvingtheradiative-transfer
equation,Trans.Theory Stat.Phys.,32,No.5-7(2003),473503.
[4℄ S.Chandrasekhar,RadiativeTransfer,DoverPubliations,NewYork,1950.
[5℄ F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, Comparison of two
le-arningstrategiesforasupervisedneuralnetwork,em 1stInternational
Sym-posium onUnertaintyQuantiationandStohastiModeling.Unertainties
2012,366380,2012.
[6℄ F. Dall Cortivo, E.S. Chalhoub, H.F. Campos Velho, A ommittee of MLP
with adaptiveslopeparameter trainedbythe quasi-Newton method to solve
problems in hydrologi optis, em IEEE International Joint Conferene on
NeuralNetworks.IJCNN 2012.(IEEE WorldCongressonComputational
In-teligene),21592166,2012.
[7℄ F. Dall Cortivo, E.S. Chalhoub, J.D.S. Silva, H.F. Campos Velho,
Estima-tivado albedodeespalhamento simplesusandouma redeneuraldemúltiplas
amadas,emAnaisdoXXXIII CNMAC,411417,SBMAC,2010.
[8℄ J.E.Dennis,J.J.Moré,Quasi-Newtonmethods,motivationandtheory,SIAM
Review,19,No.1(1977),4689.
[10℄ H.R.Gordon,A.Y.Morel,RemoteAssessmentofOeanColorfor
Interpreta-tionofSatelliteVisibleImagery,AReview,Springer-Verlag,NewYork,1983.
[11℄ L. Gross, S. Thiria, R. Frouin, B.G. Mithell, Artiial neural networks for
modelingthetransferfuntion betweenmarinereetaneandphytoplankton
pigmentonentration,J. Geophys. Res.,105,No.C2(2000),34833495.
[12℄ S.Haykin,RedesNeurais,Bookman,PortoAlegre,2001.
[13℄ S. Helmut, R. Doerer, Neural network for emulation of an inverse model
operationalderivation of CaseII water properties from MERIS data, Int. J.
Rem.Sens.,20, No.9(1999),17351746.
[14℄ L.E.Keiner,C.W.Brown,Estimatingoeanihlorophyllonentrationswith
neuralnetworks,Int.J. Rem.Sens.,20,No.1(1999),189194.
[15℄ C.D.Mobley,LightandWater,AademiPress,California,1994.
[16℄ A.Y.Morel,Lightandmarinephotosynthesis: aspetralmodelwith
geohemi-alandlimatologialimpliations,Prog.Oeanogr.,26,No.3(1991),263306.
[17℄ A.Y.Morel,L.Prieur,Analysisofvariationsinoeanolor,Limnol.Oeanogr.,
22,No.4(1977),709722.
[18℄ NAG,FortranLibraryManual,NumerialAlgorithmsGroup,Oxford,1995.
[19℄ R.C.Oliveira, N.I.A. Aevedo,A.J. SilvaNeto, L.BiondiNeto, Apliaçãode
umomitêderedesneuraisartiiaisparaasoluçãodeproblemasinversosem
TransferêniaRadiativa,TEMATend.Mat.Apl.Comput.,11,No.2(2010),
171182.
[20℄ L. Prieur, S. Sathyendranath, An optial lassiation of oastal and
oea-ni waters based onthe spei spetralabsorption urvesof phytoplankton
pigments, dissolved organi matter, and other partiulate materials, Limnol.
Oeanogr.,26, No.4(1981),671689.
[21℄ R.P.Souto,ReuperaçãodePersVertiaisdePropriedade ÓtiasInerentes
apartir daRadiação Emergente da Água,Tese de Doutorado, CAP, INPE,
SãoJosédosCampos,SP, 2006.
[22℄ R.P. Souto, H.F. Campos Velho, S. Stephany, Reonstrution of hlorophyll
vertial proles from in-situ radianes using the ant olony meta-heuristi,
IberianLatinamerianCongressonComputationalMethods, AnaisdoXXV
CILAMCE,2004.1,Reife(PE),Brasil(2004).
[23℄ R.P. Souto, H.F. Campos Velho, S. Stephany, M. Kampel, Chlorophyll
on-entrationprolesfrominsituradianesbyantolonyoptimization,J. Phys.: