• Nenhum resultado encontrado

Classificação não-supervisionada de dados hiperespectrais usando análise em componentes independentes

N/A
N/A
Protected

Academic year: 2021

Share "Classificação não-supervisionada de dados hiperespectrais usando análise em componentes independentes"

Copied!
8
0
0

Texto

(1)

Usando Analise em Componentes Independentes JoseM.P.Nascimento ? JoseM.B.Dias ?? ?

InstitutoSuperiordeEngenhariadeLisboa

Dep. deEngenhariadeElectronicaedeTelecomunicac~oesedeComputadores

R.ConselheiroEmdioNavarro,1,1949-014Lisboa

Telefone:+351.21.8317237,Fax:+351.21.8317114

E-mail: zen@isel.pt

??

InstitutoSuperiorTecnico

InstitutodeTelecomunicac~oes

Av. RoviscoPais,TorreNorte,Piso10,1049-001Lisboa

Telefone: +351.21.8418466,Fax: +351.21.841472

E-mail: bioucas@lx.it.pt

RESUMO

No passado recente foram desenvolvidas varias tecnicas para classi cac~ao de dados

hiper-spectrais. Uma abordagem tpica consiste em considerar que cada pixel e uma mistura linear

dasre ect^anciasespectraisdoselementospresentesnaceluladeresoluc~ao,adicionadaderudo.

Para classi car e estimar os elementos presentes numa imagem hiperespectral, varios

prob-lemas se colocam: Dimensionalidade dos dados, desconhecimento dos elementospresentes e a

variabilidadedare ect^anciadestes. RecentementefoipropostaaAnaliseemComponentes

Inde-pendentes,paraseparac~aode misturaslineares. Nestacomunicac~aoapresenta-seuma

metodolo-gia baseada na Analise em Componentes Independentes paradetecc~ao dos elementospresentes

em imagens hiperespectrais eestimac~ao das suas quantidades. Apresentam-se resultadosdesta

metodologia comdadossimuladosecomdados hiperespectrais reais,ilustrando apotencialidade

da tecnica.

1 Introduc~ao

O desenvolvimento de sensores de detecc~ao remota de alta resoluc~ao espectral, denominados por

sensores hiperespectrais,tem extendidoas capacidadesdos sensoresexistentes, nomeadamentena

aquisic~ao dedadossobre elementosnasuperfcieterrestre. Ainformac~aogerada porestessensores

tem inumerasaplicac~oes, nomeadamente emmapeamentoambiental,investigac~ao sobrealterac~oes



a escalaglobal,investigac~ao geofsica egeogra ca,mapeamentode zonashumidas,identi cac~aode

plantase minerais,analisede colheitase detecc~ao e classi cac~ao de actividadesde alvos[1],[2 ].

Os sensoreshiperspectrais geramimagens compostas porcentenas de bandas contguasde alta

resoluc~ao espectral (<10 nm) no espectro optico e infra vermelho, (0.4 a 2.5 m [3], [4 ]),

per-mitindo distinguir elementos numa imagem com re ect^ancias espectrais (designadas por

assinat-uras) semelhantes. Em muitoscasos a resoluc~ao espacial destessensorese de 10 a 20 metros. Em

consequ^encia, o vector de observac~ao associado a cada pixel e uma mistura de varios elementos

com concentrac~oesdistintas (designadasporabund^ancias). A comunidadecient ca tem estudado

o problemadadetecc~aodoselementospresentesna imagemeaestimac~aodasquantidadesde cada

elemento detectado.

(2)

O modelo linear de ne cada pixel como uma mistura linear das assinaturas espectrais dos

el-ementos contidos na celula de resoluc~ao, imerso em rudo [8 ]. Baseado neste modelo t^em sido

propostos varios esquemasde classi cac~ao e estimac~ao, nomeadamenteosseguintes: projecc~ao

or-togonal[9 ],[10 ],classi cac~aon~aosupervisionada[11 ],[12 ],analisedascomponentesprincipais[13 ],

estimador de maxima verosimilhanca [14 ], ltrode Match [15 ] e fus~ao de dados [16 ]. Todos estes

metodosnecessitam deconhecer previamente as assinaturasdosmateriais eprecisam de

processa-mento previopara reduzira dimens~ao dosdados. Recentemente foipropostaumatecnica quen~ao



e afectada com adimensionalidade dosdados[17 ].

Odesconhecimento dasassinaturas, doseu numeroe asua variabilidadeem cadapixel eainda

o rudo introduzidono processo de aquisic~ao das imagens hiperespectrais,afectam a robustez dos

metodosdeclassi cac~aotradicionais. Nestetrabalhoprop~oe-seumametodologiabaseadanaanalise

emcomponentesindependentesaplicadaadadoshiperespectraisprojectadosnosubespacodesinal.

A analiseem componentes independentestem vindo aser investigada [18 ] paraseparac~ao de

mis-turaslineares defontes estatisticamente independentescomdistribuic~oesn~ao-gaussianas 1

.

Acomunicac~aoorganiza-seda seguinteforma: Na Secc~ao2formula-seoproblemadaestimac~ao

dasabund^anciascomoummodelodemisturalinear;ASecc~ao3apresentasumariamenteoconceito

de analise de componentes independentes; A Secc~ao 4 aborda aspectos de reduc~ao de

dimension-alidade dos dados; Na Secc~ao 5 s~ao apresentados resultados obtidos com dados simulados e com

dados reais.

2 Modelo de Mistura Linear

O modelo de misturalinear de assinaturasemdados hiperespectraistem vindo aser utilizado em

trabalhosrecentesparadetectarequanti carelementosnumaimagem[8]. Estemodeloadmiteque

cadapixeldaimagemhiperespectraleumamisturalineardere ect^anciasespectraisresultantedos

diferentes materiais presentes. Seja um vector r de dimens~ao l x 1 representando um dado pixel

da imagem hiperespectral, com l bandas,e n outro vector de igualdimens~ao representando rudo

aditivogaussianocom media nulae vari^ancia 2

I,emque I e amatriz identidadede dimens~aol x

l. Tem-se portanto r =M +n; (1) onde M = [m 1 m 2 ::: m p

] e uma matriz de dimens~ao l x p, cujas colunas s~ao linearmente

inde-pendentes, m

k 

e um vector de dimens~ao l x 1 representando a assinatura do k-esimo elemento e

p o numerode assinaturas de interesse. Ovector =[

1 2 ::: p ] T de dimens~ao p x1 denota a

abund^ancia de cadaelemento no pixel r.

A maior di culdadeno processamento de dados hiperespectrais reside no desconhecimento da

matriz M.

1

(3)

Sejax umvector dedimens~aol x1 deobservac~oestal que

x=M ; (2)

onde M e umamatriz de dimens~ao lxp (lp)de misturadesconhecidae =[

1 2 ::: p ] T um

vectoraleatoriode dadosdesconhecidos,mutuamenteindependentesemqueapenasumadas

com-ponentes

i

podeterdistribuic~aogaussiana. Naanaliseemcomponentesindependentespretende-se

obter W,umamatriz de separac~ao de dimens~ao pxl,em que

y=Wx=PC ; (3)

onde P euma matrizde permutac~ao eC umamatriz deescala, portanto diagonal. Asmatrizes P

e C surgem aquiporquea analise em componentes independentesn~ao permitedeterminar nem a

ordem das componentes independentesnem a sua energia. Ovector y e assim uma estimativa da

fonte a menosde umfactor de escalae de umapermutac~ao.

Oprincpiobasicodadeterminac~aodascomponentesindependentestirapartidodeserasomade

duas variaveisindependentescomdistribuic~aon~ao-gaussiana \maisgaussiana" do queasvariaveis

aleatorias originais (ver, p.e., [19 ] Cap. 2.5). Deste modo, pretende-se obter uma matriz W que

maximize uma medida de n~ao gaussianidade, para cada componente do vector y. Uma medida

utilizada e a negentropia [20 ] e esta na base do algoritmo FastIca apresentado em [20 ]. Outro

criterio possvele o da minimizac~aoda informac~ao mutuade y dadapor

X

i H(y

i

) H(y): (4)

Este criterioeseguido, porexemplo,nos trabalhos[21 ],[22 ].

Neste artigo adopta-se o algoritmo FastIca [20 ] por produzirbons resultados e ser e ciente do

ponto de vistacomputacional.

Aanaliseemcomponentesindependentesassenta nospressupostosden~ao-gaussianidadee

inde-pend^enciadasfontes. Relativamenteaosdadoshiperespectraisahipoteseden~ao-gaussianidadetem

sido con rmada (ver, p.e., [23 ]). Porem, a hipotese de independ^encia n~ao se veri ca; note-se que

asfontesrepresentamabund^anciasporelemento deresoluc~ao cujasoma deve serconstante. Ainda

assim,asexperi^enciasefectuadassugeremqueeste paradigmaconduza resultadoscomsentido em

dados hiperespectraise porisso seraadoptado neste trabalho.

4 Detecc~ao do Subespaco de Sinal

O numero l de componentes de r e de ordem das dezenas ou centenas. Todavia, na aus^encia

de rudo os vectores de observac~ao pertencem a um subespaco de dimens~ao p, normalmente de

(4)

de sinal geradopelamatriz M. Oprojector neste sub-espacoe dadopor[24 ] P M =U P U T P ; (5) ondeU P

eamatrizdospvectorespropriosdamatrizdecorrelac~aodosdadosobservadosassociados

aos p maioresvalores proprios. Cada pixel e ent~ao representado porum vector de dimens~ao p x1

dadopor r 0 =U T P r: (6)

Banda nº43 duma imagem

hiperespectral AVIRIS

50

100

150

200

20

40

60

80

100

120

140

160

180

0

50

100

150

0

2

4

6

8

Modúlo dos valores próprios (log )

banda i

10

log

10

i

Figura 1: Esquerda: Banda de imagem hiperespectral AVIRIS (canal 0:76m); Direita: Modulo

dos valores proprios damatriz de correlac~aodos dadosobservados emescalalogartmica.

Por observac~ao da Figura 1, conclui-se que apenas os primeiros p = 10 valores proprios t^em

energia signi cativa. Notar que os restantes t^em valores menores do que tr^es ordensde grandeza

do maior valor proprio. Com esta reduc~ao de dimensionalidade veri ca-se tambem o aumento da

relac~ao sinalrudode umfactor de l=p [10].

5 Resultados Experimentais

Ometodopropostoetestadoprimeirocomdadossimuladosedepoiscomdadosreais. Noprimeiro

casosimula-seumaimagemhiperespectralde30linhaspor20colunas,ondecadapixeleumvector

com 224 bandas (l=224) resultante da misturalinear de 3 materiais (p=3)cujas re ect^ancias s~ao

extradas de umabase de dadose asabund^anciassimuladass~ao apresentadas na Figura2.

Ostestes realizados medema e ci^encia do metodo propostocom diferentes relac~oes sinalrudo

(SNR) de nidocomo SNR=10log  ij km ij k 2 =l  2 ; (7) onde m ij 

e i-esimo elemento da assinatura m

j e 

2

a vari^ancia dorudo. Orudopode ser

descor-relacionado ou correlacionadocomuma matriz decovari^ancia dadapor

R =E[nn ]= ji jj

(5)

0

5

10

15

20

0

10

20

30

0

0.1

0.2

α

1

0

5

10

15

20

0

10

20

30

0

0.1

0.2

α

2

0

10

20

0

10

20

30

0

0.1

0.2

α

3

0.5

1

1.5

2

2.5

0

0.2

0.4

0.6

0.8

1

Reflectancia Espectral

λ [µm]

Figura 2: No topo e na esquerda em baixo: Abund^ancias dos materiais; Na direita em baixo:

Re ect^anciasespectrais de tr^esmateriaisemfunc~ao documprimento de ondaemm.

com umafactor de correlac~ao  =0:9. Para medir a raz~ao de semelhanca entre a abund^ancia do

i-esimo material ea suaestimativa utiliza-sea seguintemedidade desempenho

R dB =10log kD ij j k 2 ky i D ij j k 2 ; (9)

onde D = WM e uma matriz p x p, sendo a matriz W resultante do algoritmo FastIca,

j a

abund^ancia do materiale y

i

asua estimativa. A Figura3 apresenta a estimativa dasabund^ancias

para os tr^es materiais com uma relac~ao sinal rudo de 5 dB. Nesta gura pode-se veri car que as

abund^anciasestimadas est~ao escaladase permutadas.

0

10

20

0

10

20

30

0

5

10

y

1

0

10

20

0

10

20

30

10

5

0

y

2

0

10

20

0

10

20

30

0

5

10

y

3

Figura3: Estimativa dasabund^anciasdos3 materiais,com SNR =5dB.

Na Figura 4 (gra co a esquerda) e apresentada a raz~ao de semelhanca em dB em func~ao da

(6)

-5

0

5

10

-10

0

10

20

30

RdB para material 1

SNR (dB)

-5

0

5

10

-10

0

10

20

30

RdB para material 1

SNR (dB)

Figura 4: Raz~ao de semelhanca em func~ao de SNR com rudo descorrelacionado(linha contnua)

e rudocorrelacionado comfactor de 0.9 (linhainterrompida); Esquerda: 3materiaispresentesna

imagem; Direita: 5materiaispresentesna imagem;

Realizou-seoutro teste emquea imagemhiperespectrale formadaporumamisturalinear de5

materiais adicionadade rudo. Nestas condic~oes a medidade desempenho, para a mesma relac~ao

sinal rudo, e menorqueno primeiro teste realizado(ver Fig. 4a direita).

Finalmente realizaram-se testes com dados hiperespectrais reais. Para modelizar a

variabili-dadeassociadaaumadadaassinatura,extraiu-seconjuntoss

i

deassinaturasde tr^eszonasde uma

imagem hiperespectralcorrespondentes a tr^es materiaisdiferentes (ver Fig. 5). A imagem

hipere-spectral foi posteriormente construda de acordo com as abund^ancias geradas. Em cada pixel a

assinatura m

i

foiescolhidaaleatoriamente doconjunto s

i

referidoanteriormente.

Oprocedimentodescritoserveparagerarumaimagemapartirdedadosreaisemqueseintroduz

variabilidadedentro damesma assinatura,de forma controladae proximada realidade.

Numaimagemhiperespectral,cadaelementoderesoluc~aorepresentaamisturadoscomponentes

presentes na area observada. As quantidades de cada componente representado num pixel esta,

assim,compreendido entre0e1,sendoasoma sempreconstante. Neste pressuposto,aquantidade

de um doscomponentesda misturae dependente dasrestantes. Assim, aanaliseem componentes

independentesdeterminaapenasas abund^anciasdo numerode componentesa menosde uma.

Procede-seent~aodaseguinteforma: Extrai-sedasabund^anciasestimadaspeloalgoritmoFastIca

os pixels que tem valor maximo considerando estes como as assinaturas de dois materiais. A

assinatura do terceiro material e determinada quando as abund^ancias estimadas tem o seu valor

mnimo. O resultado nal obt^em-se pelo produto da pseudo-inversa da matriz constituda pelas

assinaturasobtidaspelaimagemhiperespectral. AFigura6apresentaaabund^anciadeummaterial

e a sua estimativa para todos os pixels. Com estes resultados conclui-se que a determinac~ao das

abund^ancias dos componentese in u^enciada porquatro factores: A dimensionalidade dos dados,

a variabilidade das assinaturas, o numero de materiais presentes na imagem hiperespectral e o

rudono quala misturaesta imersa. Todosestesfactores perturbamodesempenhoda analise em

(7)

Banda da Imagem Hiperespectral

A

B

C

0

50

100

150

200

0

0.2

0.4

0.6

0.8

1

Reflectancia Espectral

Numero da banda

Figura 5: Esquerda: Banda da imagem hiperespectral (em amarelo as zonas de extracc~ao de

assinaturas); Direita: Assinaturasextraidasdas tr^es zonasda imagem.

0

50

100

150

200

0

0.2

0.4

0.6

0.8

1

α

1

e

α

1

Numero do pixel na imagem

^

Figura 6: Abund^anciasde ummateriale suaestimativa emfunc~ao dospixelsdaimagem.

6 Conclus~oes

Nesta comunicac~ao apresentou-se uma metodologia de classi cac~ao n~ao supervisionada de dados

hiperespectraisbaseadanaAnalisedeComponentesIndependentes. Foiadoptadoomodelode

mis-tura linearpara representarosdadoshiperespectrais. Ofactode seprojectar osdadosobservados

numsubespacodedimens~aomenorpermitereduzirorudodeobservac~aoeadimensionalidadedos

dados. Comosresultadosapresentados concluiu-sequea analiseemcomponentesindependentese

e caz na determinac~ao das abund^anciasdos materiais presentes na imagem hiperespectral, sendo

o seudesempenhoin u^enciadopelosseguintesfactores: A dimensionalidadedosdados,a

variabili-dadedasassinaturas,o numerodemateriaispresentes naimagem hiperespectrale orudonoqual

a misturaesta emersa.

S~ao objectivos de trabalho futuro o estudo de tecnicas de determinac~ao do numero de

com-ponentes que geram a imagem hiperespectrais e a modi cac~ao do procedimento de analise em

(8)

REFERENCIAS

[1] M.O.Smith,P.E.Johnson,andJ.B.Adams,\QuantitativeDeterminationofMineralTypesandAbundances

fromRe ectanceSpectraUsingPrincipalComponentAnalysis"inProc.15thLunarandPlanetarySci.Conf.,

Part2,Geophys.Res.,Vol.90,Suppl.,pp.C797-C804,Feb.15,1985.

[2] A.R.Gillespie,M. O.Smith,J.B.Adams,S.C.Willis,A.F.Fisher,III,andD.E.Sabol,\Intrepretationof

ResidualImages: SpectralMixtureAnalysisofAVIRISImages,OwensValley,California"inProc2ndAVIRIS

Workshop,R.O.Green, Ed.,JplPubl.90-54,243-270.

[3] T.LillesandandR.Kiefer,\RemoteSensingandImageInterpretation",3 a

ed.,JohnWiley&Sons,Inc.,1994.

[4] G.Vane, R.Green, T.Chrien, H. Enmark,E. Hansen eW. Porter,\The Airborne Visible/Infrared Imaging

Spectrometer(AVIRIS)",RemoteSens.Environ.,vol44, pp.127-143,May.1993.

[5] J.B.Adams eM. O.Smith,\A New AnalysisofRockans SoilTypesat theVikingLander 1site." inJ.of

GeophysicalResearch,91(B8):8098-8112, 1986.

[6] B.Hapke,\BidirectionRe ectancespectroscopy.I.Theory",J.Geophys.Res.,vol86, pp.3039-3054,Apr.10,

1981.

[7] P.Johnson, M. Smith, S.Taylor-George, and J. Adams, \A semiempirical methodfor analisys of re ectance

spectraofbinarymineralmixtures",J.Geophys.Res.,vol88,pp.3357-3561, 1983.

[8] J. B.Adams, M. O.Smiths e A. R.Gillespie, \Remote Geochemical analysis: Elemental and Mineralogical

Composition",imagingspectroscopy: intrepretationbasedonspectralmixtureanalysis,C.PietersandP.Englert,

Eds.Cambridge: CambridgeUniv.Press,pp.145-166,1993.

[9] J. C.Harsanyi and Chein-IChang, \HiperspectralImageClassi cation andSubspace Projection Approach",

IEEETrans.OnGeosciense andRemote Sensing,Vol32,No.4,July1994.

[10] C.Chang,X.Zhao,M.L.G.AlthouseandJ.J.Pan,\Least SquaresSubspaceProjectionApproachtoMixed

PixelClassi cationforHiperspectralImages",IEEETrans.OnGeoscienseandRemoteSensing,Vol36,No.3,

May1998.

[11] A. Ifarraguerri and C.Chang, \Unsupervised Hiperspectral Image Analysis with Projection Pursuit", IEEE

Trans.OnGeosciense andRemoteSensing, Vol38, No.6,November2000.

[12] H.RenandC.Chang,\AGeneralizedOrthogonalSubspaceProjectionAppoachtoUnsupervisedMultispectral

ImageClassi cation", IEEETrans.On GeoscienseandRemoteSensing,Vol38,No.6,November2000.

[13] A.R.Heute,\Separation ofSoil-plantSpectralMixturesby FactorAnalysis",Remote sens.Environ.,vol.19,

pp.237-251,1986.

[14] J.J.Settle,\OntheRelationshipbetweenSpectralUnmixingandSubspaceProjection", IEEEtrans.Geosci.

RemoteSensing,vol.34, pp.1045-1046,July1996.

[15] A.S.Mazer,M.Martinetal.\Image ProcessingSoftwarefor ImagingSpectrometryDataAnalysis",Remote

SensingEnvirom.,vol.24,n o

1,pp201-210,1988.

[16] JunpingZhang, Ye Zhang, etal. \Fusion classi cationof Hyperspectral ImageBasedon AdaptiveSubspace

Decomposition",ICIP2000,Canada,pp.472-475,2000.

[17] Junping Zhang, Ye Zhang and Tingxian Zhou, \Classi cation of Hyperspectral Data Using SupportVector

Machines", ICIP2001,pp.882-885,2001.

[18] P.Common,\IndependentComponentAnalysis:ANew Concept",SignalProcessing,36, pp287-314,1994.

[19] RichardO.Duda,PeterE.HartandDavidG.Stork,\PatternClassi cation",2 a

ed.,JohnWiley&Sons,Inc.,

2001.

[20] Aapo Hyvarinen and Erkki Oja, \Independet Componente Analisys: Algorithms and Aplications", Neural

Networks,13(4-5):411-430,2000.

[21] A.J.BellandT.J.Sejnowski,\AnInformation-maximizationApproachtoBlindSeparationandBlind

Decon-volution",NeuralComputation,10,215-234,1995.

[22] J.F.Cardoso,\InformaxandMaximumLikelihoodfoSourceSeparation",IEEE Trans.onSignalProcessing,

44,3017-3030, 1996.

[23] DimitrisManolakis,ChristinaSiracusaandGaryShaw,\HyperspectralSubpixelTargetDetectionUsingLinear

MixingModel",IEEETrans.OnGeosciense andRemote Sensing,Vol.39, N o

7,pp1392-1409,July2001.

[24] LouisL.Sharf,\StatisticalSignalProcessing,Detection,EstimationendTimeSeriesAnalysis",Addison-Wesley

Imagem

Figura 1: Esquerda: Banda de imagem hiperespectral A VIRIS (canal 0:76m); Direita: M odulo
Figura 2: No topo e na esquerda em baixo: Abund^ ancias dos materiais; Na direita em baixo:
Figura 4: Raz~ ao de semelhan ca em fun c~ ao de SNR com ru  do descorrelacionado (linha cont nua)
Figura 5: Esquerda: Banda da imagem hiperespectral (em amarelo as zonas de extrac c~ ao de

Referências

Documentos relacionados

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

Os resultados indicam que fertilizantes, defensivos, corretivos e sacarias não podem ser agregados em um único fator de produção denominado de insumos, considerando-se

No dia de realização da Prova Escrita, o candidato deverá comparecer ao local designado para prestar a prova com antecedência mínima de 30 (trinta) minutos de seu início, munido

Tendo em vista que a metoclopramida pode acelerar o trânsito alimentar do estômago para o intestino e, consequentemente, a porcentagem de absorção de substâncias, a dose de insulina

Para investigar a influência da presença da água durante o processo de craqueamento térmico, foram realizadas micropirólises utilizando a borra do óleo de algodão seca e úmida..

Dos 20 podcasts catalogados na pesquisa, oito pertencem a iniciativas que possuem alguma ligação com os Cursos de Comunicação Social, seja por meio de

No entanto, com a crescente participação dos custos indiretos, a partir dos processos de automatização (máquinas e equipamentos substituindo mão-de-obra), e a

reddish and green galls induced by Palaeomystella oligophaga on Macairea radula leafs.. Scores of the two first axes of the principal component analysis (PCA)