Usando Analise em Componentes Independentes JoseM.P.Nascimento ? JoseM.B.Dias ?? ?
InstitutoSuperiordeEngenhariadeLisboa
Dep. deEngenhariadeElectronicaedeTelecomunicac~oesedeComputadores
R.ConselheiroEmdioNavarro,1,1949-014Lisboa
Telefone:+351.21.8317237,Fax:+351.21.8317114
E-mail: zen@isel.pt
??
InstitutoSuperiorTecnico
InstitutodeTelecomunicac~oes
Av. RoviscoPais,TorreNorte,Piso10,1049-001Lisboa
Telefone: +351.21.8418466,Fax: +351.21.841472
E-mail: bioucas@lx.it.pt
RESUMO
No passado recente foram desenvolvidas varias tecnicas para classicac~ao de dados
hiper-spectrais. Uma abordagem tpica consiste em considerar que cada pixel e uma mistura linear
dasre ect^anciasespectraisdoselementospresentesnaceluladeresoluc~ao,adicionadaderudo.
Para classicar e estimar os elementos presentes numa imagem hiperespectral, varios
prob-lemas se colocam: Dimensionalidade dos dados, desconhecimento dos elementospresentes e a
variabilidadedare ect^anciadestes. RecentementefoipropostaaAnaliseemComponentes
Inde-pendentes,paraseparac~aode misturaslineares. Nestacomunicac~aoapresenta-seuma
metodolo-gia baseada na Analise em Componentes Independentes paradetecc~ao dos elementospresentes
em imagens hiperespectrais eestimac~ao das suas quantidades. Apresentam-se resultadosdesta
metodologia comdadossimuladosecomdados hiperespectrais reais,ilustrando apotencialidade
da tecnica.
1 Introduc~ao
O desenvolvimento de sensores de detecc~ao remota de alta resoluc~ao espectral, denominados por
sensores hiperespectrais,tem extendidoas capacidadesdos sensoresexistentes, nomeadamentena
aquisic~ao dedadossobre elementosnasuperfcieterrestre. Ainformac~aogerada porestessensores
tem inumerasaplicac~oes, nomeadamente emmapeamentoambiental,investigac~ao sobrealterac~oes
a escalaglobal,investigac~ao geofsica egeograca,mapeamentode zonashumidas,identicac~aode
plantase minerais,analisede colheitase detecc~ao e classicac~ao de actividadesde alvos[1],[2 ].
Os sensoreshiperspectrais geramimagens compostas porcentenas de bandas contguasde alta
resoluc~ao espectral (<10 nm) no espectro optico e infra vermelho, (0.4 a 2.5 m [3], [4 ]),
per-mitindo distinguir elementos numa imagem com re ect^ancias espectrais (designadas por
assinat-uras) semelhantes. Em muitoscasos a resoluc~ao espacial destessensorese de 10 a 20 metros. Em
consequ^encia, o vector de observac~ao associado a cada pixel e uma mistura de varios elementos
com concentrac~oesdistintas (designadasporabund^ancias). A comunidadecientca tem estudado
o problemadadetecc~aodoselementospresentesna imagemeaestimac~aodasquantidadesde cada
elemento detectado.
O modelo linear dene cada pixel como uma mistura linear das assinaturas espectrais dos
el-ementos contidos na celula de resoluc~ao, imerso em rudo [8 ]. Baseado neste modelo t^em sido
propostos varios esquemasde classicac~ao e estimac~ao, nomeadamenteosseguintes: projecc~ao
or-togonal[9 ],[10 ],classicac~aon~aosupervisionada[11 ],[12 ],analisedascomponentesprincipais[13 ],
estimador de maxima verosimilhanca [14 ], ltrode Match [15 ] e fus~ao de dados [16 ]. Todos estes
metodosnecessitam deconhecer previamente as assinaturasdosmateriais eprecisam de
processa-mento previopara reduzira dimens~ao dosdados. Recentemente foipropostaumatecnica quen~ao
e afectada com adimensionalidade dosdados[17 ].
Odesconhecimento dasassinaturas, doseu numeroe asua variabilidadeem cadapixel eainda
o rudo introduzidono processo de aquisic~ao das imagens hiperespectrais,afectam a robustez dos
metodosdeclassicac~aotradicionais. Nestetrabalhoprop~oe-seumametodologiabaseadanaanalise
emcomponentesindependentesaplicadaadadoshiperespectraisprojectadosnosubespacodesinal.
A analiseem componentes independentestem vindo aser investigada [18 ] paraseparac~ao de
mis-turaslineares defontes estatisticamente independentescomdistribuic~oesn~ao-gaussianas 1
.
Acomunicac~aoorganiza-seda seguinteforma: Na Secc~ao2formula-seoproblemadaestimac~ao
dasabund^anciascomoummodelodemisturalinear;ASecc~ao3apresentasumariamenteoconceito
de analise de componentes independentes; A Secc~ao 4 aborda aspectos de reduc~ao de
dimension-alidade dos dados; Na Secc~ao 5 s~ao apresentados resultados obtidos com dados simulados e com
dados reais.
2 Modelo de Mistura Linear
O modelo de misturalinear de assinaturasemdados hiperespectraistem vindo aser utilizado em
trabalhosrecentesparadetectarequanticarelementosnumaimagem[8]. Estemodeloadmiteque
cadapixeldaimagemhiperespectraleumamisturalineardere ect^anciasespectraisresultantedos
diferentes materiais presentes. Seja um vector r de dimens~ao l x 1 representando um dado pixel
da imagem hiperespectral, com l bandas,e n outro vector de igualdimens~ao representando rudo
aditivogaussianocom media nulae vari^ancia 2
I,emque I e amatriz identidadede dimens~aol x
l. Tem-se portanto r =M+n; (1) onde M = [m 1 m 2 ::: m p
] e uma matriz de dimens~ao l x p, cujas colunas s~ao linearmente
inde-pendentes, m
k
e um vector de dimens~ao l x 1 representando a assinatura do k-esimo elemento e
p o numerode assinaturas de interesse. Ovector =[
1 2 ::: p ] T de dimens~ao p x1 denota a
abund^ancia de cadaelemento no pixel r.
A maior diculdadeno processamento de dados hiperespectrais reside no desconhecimento da
matriz M.
1
Sejax umvector dedimens~aol x1 deobservac~oestal que
x=M; (2)
onde M e umamatriz de dimens~ao lxp (lp)de misturadesconhecidae =[
1 2 ::: p ] T um
vectoraleatoriode dadosdesconhecidos,mutuamenteindependentesemqueapenasumadas
com-ponentes
i
podeterdistribuic~aogaussiana. Naanaliseemcomponentesindependentespretende-se
obter W,umamatriz de separac~ao de dimens~ao pxl,em que
y=Wx=PC; (3)
onde P euma matrizde permutac~ao eC umamatriz deescala, portanto diagonal. Asmatrizes P
e C surgem aquiporquea analise em componentes independentesn~ao permitedeterminar nem a
ordem das componentes independentesnem a sua energia. Ovector y e assim uma estimativa da
fonte a menosde umfactor de escalae de umapermutac~ao.
Oprincpiobasicodadeterminac~aodascomponentesindependentestirapartidodeserasomade
duas variaveisindependentescomdistribuic~aon~ao-gaussiana \maisgaussiana" do queasvariaveis
aleatorias originais (ver, p.e., [19 ] Cap. 2.5). Deste modo, pretende-se obter uma matriz W que
maximize uma medida de n~ao gaussianidade, para cada componente do vector y. Uma medida
utilizada e a negentropia [20 ] e esta na base do algoritmo FastIca apresentado em [20 ]. Outro
criterio possvele o da minimizac~aoda informac~ao mutuade y dadapor
X
i H(y
i
) H(y): (4)
Este criterioeseguido, porexemplo,nos trabalhos[21 ],[22 ].
Neste artigo adopta-se o algoritmo FastIca [20 ] por produzirbons resultados e ser eciente do
ponto de vistacomputacional.
Aanaliseemcomponentesindependentesassenta nospressupostosden~ao-gaussianidadee
inde-pend^enciadasfontes. Relativamenteaosdadoshiperespectraisahipoteseden~ao-gaussianidadetem
sido conrmada (ver, p.e., [23 ]). Porem, a hipotese de independ^encia n~ao se verica; note-se que
asfontesrepresentamabund^anciasporelemento deresoluc~ao cujasoma deve serconstante. Ainda
assim,asexperi^enciasefectuadassugeremqueeste paradigmaconduza resultadoscomsentido em
dados hiperespectraise porisso seraadoptado neste trabalho.
4 Detecc~ao do Subespaco de Sinal
O numero l de componentes de r e de ordem das dezenas ou centenas. Todavia, na aus^encia
de rudo os vectores de observac~ao pertencem a um subespaco de dimens~ao p, normalmente de
de sinal geradopelamatriz M. Oprojector neste sub-espacoe dadopor[24 ] P M =U P U T P ; (5) ondeU P
eamatrizdospvectorespropriosdamatrizdecorrelac~aodosdadosobservadosassociados
aos p maioresvalores proprios. Cada pixel e ent~ao representado porum vector de dimens~ao p x1
dadopor r 0 =U T P r: (6)
Banda nº43 duma imagem
hiperespectral AVIRIS
50
100
150
200
20
40
60
80
100
120
140
160
180
0
50
100
150
0
2
4
6
8
Modúlo dos valores próprios (log )
banda i
10
log
10
i
Figura 1: Esquerda: Banda de imagem hiperespectral AVIRIS (canal 0:76m); Direita: Modulo
dos valores proprios damatriz de correlac~aodos dadosobservados emescalalogartmica.
Por observac~ao da Figura 1, conclui-se que apenas os primeiros p = 10 valores proprios t^em
energia signicativa. Notar que os restantes t^em valores menores do que tr^es ordensde grandeza
do maior valor proprio. Com esta reduc~ao de dimensionalidade verica-se tambem o aumento da
relac~ao sinalrudode umfactor de l=p [10].
5 Resultados Experimentais
Ometodopropostoetestadoprimeirocomdadossimuladosedepoiscomdadosreais. Noprimeiro
casosimula-seumaimagemhiperespectralde30linhaspor20colunas,ondecadapixeleumvector
com 224 bandas (l=224) resultante da misturalinear de 3 materiais (p=3)cujas re ect^ancias s~ao
extradas de umabase de dadose asabund^anciassimuladass~ao apresentadas na Figura2.
Ostestes realizados medema eci^encia do metodo propostocom diferentes relac~oes sinalrudo
(SNR) denidocomo SNR=10log ij km ij k 2 =l 2 ; (7) onde m ij
e i-esimo elemento da assinatura m
j e
2
a vari^ancia dorudo. Orudopode ser
descor-relacionado ou correlacionadocomuma matriz decovari^ancia dadapor
R =E[nn ]= ji jj
0
5
10
15
20
0
10
20
30
0
0.1
0.2
α
1
0
5
10
15
20
0
10
20
30
0
0.1
0.2
α
2
0
10
20
0
10
20
30
0
0.1
0.2
α
3
0.5
1
1.5
2
2.5
0
0.2
0.4
0.6
0.8
1
Reflectancia Espectral
λ [µm]
Figura 2: No topo e na esquerda em baixo: Abund^ancias dos materiais; Na direita em baixo:
Re ect^anciasespectrais de tr^esmateriaisemfunc~ao documprimento de ondaemm.
com umafactor de correlac~ao =0:9. Para medir a raz~ao de semelhanca entre a abund^ancia do
i-esimo material ea suaestimativa utiliza-sea seguintemedidade desempenho
R dB =10log kD ij j k 2 ky i D ij j k 2 ; (9)
onde D = WM e uma matriz p x p, sendo a matriz W resultante do algoritmo FastIca,
j a
abund^ancia do materiale y
i
asua estimativa. A Figura3 apresenta a estimativa dasabund^ancias
para os tr^es materiais com uma relac~ao sinal rudo de 5 dB. Nesta gura pode-se vericar que as
abund^anciasestimadas est~ao escaladase permutadas.
0
10
20
0
10
20
30
0
5
10
y
1
0
10
20
0
10
20
30
10
5
0
y
2
0
10
20
0
10
20
30
0
5
10
y
3
Figura3: Estimativa dasabund^anciasdos3 materiais,com SNR =5dB.
Na Figura 4 (graco a esquerda) e apresentada a raz~ao de semelhanca em dB em func~ao da
-5
0
5
10
-10
0
10
20
30
RdB para material 1
SNR (dB)
-5
0
5
10
-10
0
10
20
30
RdB para material 1
SNR (dB)
Figura 4: Raz~ao de semelhanca em func~ao de SNR com rudo descorrelacionado(linha contnua)
e rudocorrelacionado comfactor de 0.9 (linhainterrompida); Esquerda: 3materiaispresentesna
imagem; Direita: 5materiaispresentesna imagem;
Realizou-seoutro teste emquea imagemhiperespectrale formadaporumamisturalinear de5
materiais adicionadade rudo. Nestas condic~oes a medidade desempenho, para a mesma relac~ao
sinal rudo, e menorqueno primeiro teste realizado(ver Fig. 4a direita).
Finalmente realizaram-se testes com dados hiperespectrais reais. Para modelizar a
variabili-dadeassociadaaumadadaassinatura,extraiu-seconjuntoss
i
deassinaturasde tr^eszonasde uma
imagem hiperespectralcorrespondentes a tr^es materiaisdiferentes (ver Fig. 5). A imagem
hipere-spectral foi posteriormente construda de acordo com as abund^ancias geradas. Em cada pixel a
assinatura m
i
foiescolhidaaleatoriamente doconjunto s
i
referidoanteriormente.
Oprocedimentodescritoserveparagerarumaimagemapartirdedadosreaisemqueseintroduz
variabilidadedentro damesma assinatura,de forma controladae proximada realidade.
Numaimagemhiperespectral,cadaelementoderesoluc~aorepresentaamisturadoscomponentes
presentes na area observada. As quantidades de cada componente representado num pixel esta,
assim,compreendido entre0e1,sendoasoma sempreconstante. Neste pressuposto,aquantidade
de um doscomponentesda misturae dependente dasrestantes. Assim, aanaliseem componentes
independentesdeterminaapenasas abund^anciasdo numerode componentesa menosde uma.
Procede-seent~aodaseguinteforma: Extrai-sedasabund^anciasestimadaspeloalgoritmoFastIca
os pixels que tem valor maximo considerando estes como as assinaturas de dois materiais. A
assinatura do terceiro material e determinada quando as abund^ancias estimadas tem o seu valor
mnimo. O resultado nal obt^em-se pelo produto da pseudo-inversa da matriz constituda pelas
assinaturasobtidaspelaimagemhiperespectral. AFigura6apresentaaabund^anciadeummaterial
e a sua estimativa para todos os pixels. Com estes resultados conclui-se que a determinac~ao das
abund^ancias dos componentese in u^enciada porquatro factores: A dimensionalidade dos dados,
a variabilidade das assinaturas, o numero de materiais presentes na imagem hiperespectral e o
rudono quala misturaesta imersa. Todosestesfactores perturbamodesempenhoda analise em
Banda da Imagem Hiperespectral
A
B
C
0
50
100
150
200
0
0.2
0.4
0.6
0.8
1
Reflectancia Espectral
Numero da banda
Figura 5: Esquerda: Banda da imagem hiperespectral (em amarelo as zonas de extracc~ao de
assinaturas); Direita: Assinaturasextraidasdas tr^es zonasda imagem.
0
50
100
150
200
0
0.2
0.4
0.6
0.8
1
α
1
e
α
1
Numero do pixel na imagem
^
Figura 6: Abund^anciasde ummateriale suaestimativa emfunc~ao dospixelsdaimagem.
6 Conclus~oes
Nesta comunicac~ao apresentou-se uma metodologia de classicac~ao n~ao supervisionada de dados
hiperespectraisbaseadanaAnalisedeComponentesIndependentes. Foiadoptadoomodelode
mis-tura linearpara representarosdadoshiperespectrais. Ofactode seprojectar osdadosobservados
numsubespacodedimens~aomenorpermitereduzirorudodeobservac~aoeadimensionalidadedos
dados. Comosresultadosapresentados concluiu-sequea analiseemcomponentesindependentese
ecaz na determinac~ao das abund^anciasdos materiais presentes na imagem hiperespectral, sendo
o seudesempenhoin u^enciadopelosseguintesfactores: A dimensionalidadedosdados,a
variabili-dadedasassinaturas,o numerodemateriaispresentes naimagem hiperespectrale orudonoqual
a misturaesta emersa.
S~ao objectivos de trabalho futuro o estudo de tecnicas de determinac~ao do numero de
com-ponentes que geram a imagem hiperespectrais e a modicac~ao do procedimento de analise em
REFERENCIAS
[1] M.O.Smith,P.E.Johnson,andJ.B.Adams,\QuantitativeDeterminationofMineralTypesandAbundances
fromRe ectanceSpectraUsingPrincipalComponentAnalysis"inProc.15thLunarandPlanetarySci.Conf.,
Part2,Geophys.Res.,Vol.90,Suppl.,pp.C797-C804,Feb.15,1985.
[2] A.R.Gillespie,M. O.Smith,J.B.Adams,S.C.Willis,A.F.Fisher,III,andD.E.Sabol,\Intrepretationof
ResidualImages: SpectralMixtureAnalysisofAVIRISImages,OwensValley,California"inProc2ndAVIRIS
Workshop,R.O.Green, Ed.,JplPubl.90-54,243-270.
[3] T.LillesandandR.Kiefer,\RemoteSensingandImageInterpretation",3 a
ed.,JohnWiley&Sons,Inc.,1994.
[4] G.Vane, R.Green, T.Chrien, H. Enmark,E. Hansen eW. Porter,\The Airborne Visible/Infrared Imaging
Spectrometer(AVIRIS)",RemoteSens.Environ.,vol44, pp.127-143,May.1993.
[5] J.B.Adams eM. O.Smith,\A New AnalysisofRockans SoilTypesat theVikingLander 1site." inJ.of
GeophysicalResearch,91(B8):8098-8112, 1986.
[6] B.Hapke,\BidirectionRe ectancespectroscopy.I.Theory",J.Geophys.Res.,vol86, pp.3039-3054,Apr.10,
1981.
[7] P.Johnson, M. Smith, S.Taylor-George, and J. Adams, \A semiempirical methodfor analisys of re ectance
spectraofbinarymineralmixtures",J.Geophys.Res.,vol88,pp.3357-3561, 1983.
[8] J. B.Adams, M. O.Smiths e A. R.Gillespie, \Remote Geochemical analysis: Elemental and Mineralogical
Composition",imagingspectroscopy: intrepretationbasedonspectralmixtureanalysis,C.PietersandP.Englert,
Eds.Cambridge: CambridgeUniv.Press,pp.145-166,1993.
[9] J. C.Harsanyi and Chein-IChang, \HiperspectralImageClassication andSubspace Projection Approach",
IEEETrans.OnGeosciense andRemote Sensing,Vol32,No.4,July1994.
[10] C.Chang,X.Zhao,M.L.G.AlthouseandJ.J.Pan,\Least SquaresSubspaceProjectionApproachtoMixed
PixelClassicationforHiperspectralImages",IEEETrans.OnGeoscienseandRemoteSensing,Vol36,No.3,
May1998.
[11] A. Ifarraguerri and C.Chang, \Unsupervised Hiperspectral Image Analysis with Projection Pursuit", IEEE
Trans.OnGeosciense andRemoteSensing, Vol38, No.6,November2000.
[12] H.RenandC.Chang,\AGeneralizedOrthogonalSubspaceProjectionAppoachtoUnsupervisedMultispectral
ImageClassication", IEEETrans.On GeoscienseandRemoteSensing,Vol38,No.6,November2000.
[13] A.R.Heute,\Separation ofSoil-plantSpectralMixturesby FactorAnalysis",Remote sens.Environ.,vol.19,
pp.237-251,1986.
[14] J.J.Settle,\OntheRelationshipbetweenSpectralUnmixingandSubspaceProjection", IEEEtrans.Geosci.
RemoteSensing,vol.34, pp.1045-1046,July1996.
[15] A.S.Mazer,M.Martinetal.\Image ProcessingSoftwarefor ImagingSpectrometryDataAnalysis",Remote
SensingEnvirom.,vol.24,n o
1,pp201-210,1988.
[16] JunpingZhang, Ye Zhang, etal. \Fusion classicationof Hyperspectral ImageBasedon AdaptiveSubspace
Decomposition",ICIP2000,Canada,pp.472-475,2000.
[17] Junping Zhang, Ye Zhang and Tingxian Zhou, \Classication of Hyperspectral Data Using SupportVector
Machines", ICIP2001,pp.882-885,2001.
[18] P.Common,\IndependentComponentAnalysis:ANew Concept",SignalProcessing,36, pp287-314,1994.
[19] RichardO.Duda,PeterE.HartandDavidG.Stork,\PatternClassication",2 a
ed.,JohnWiley&Sons,Inc.,
2001.
[20] Aapo Hyvarinen and Erkki Oja, \Independet Componente Analisys: Algorithms and Aplications", Neural
Networks,13(4-5):411-430,2000.
[21] A.J.BellandT.J.Sejnowski,\AnInformation-maximizationApproachtoBlindSeparationandBlind
Decon-volution",NeuralComputation,10,215-234,1995.
[22] J.F.Cardoso,\InformaxandMaximumLikelihoodfoSourceSeparation",IEEE Trans.onSignalProcessing,
44,3017-3030, 1996.
[23] DimitrisManolakis,ChristinaSiracusaandGaryShaw,\HyperspectralSubpixelTargetDetectionUsingLinear
MixingModel",IEEETrans.OnGeosciense andRemote Sensing,Vol.39, N o
7,pp1392-1409,July2001.
[24] LouisL.Sharf,\StatisticalSignalProcessing,Detection,EstimationendTimeSeriesAnalysis",Addison-Wesley