Agrupamento espectral para dados de formas

(1)

Centro de Ciên ias Exatas e da Natureza

Departamento de Estatísti a

Agrupamento Espe tral para Dados de Formas

Diogo Vas on elos Cândido

(2)

Agrupamento Espe tral para Dados de Formas

Monograa apresentada ao Curso de

Ba- harelado em Estatísti ada Universidade

FederaldaParaíba omo requisitopar ial

paraobtenção doGrau deBa harel. Área

de Con entração: Estatísti aApli ada.

João Pessoa

(3)

(4)

(5)

que, ertamente, em muito me agregaram ao longo

(6)

AgradeçoaoSenhorDeus, pelodom davidaepormepermitirdar maisum passo,ao

on luiresta graduação. Sem Ele,nada poderiater sido feito.

Aos meus pais, Ginaldo e Sandra, obrigadopor serem meus maiores in entivadores e

patro inadores. Queridos pais, essa onquista évossa. Minha eterna gratidãopor todoo

esforço empenhando emmeu favor.

À vo ê, minhasegunda professora de todas as dis iplinas,um obrigado do tamanho

do meu amor por ti. Foram 8 períodos de ontínuo suporte. Das mais simples até as

mais omplexas dis iplinas, dos numerosos trabalhos em equipe e das innitas listas de

exer í ios. Certamente eu ainda estaria no meio do aminho se vo ê não estivesse nele.

Obrigado, Adeni e.

Meus amigos de turma, André e Anny, vo ês são pra vida toda. Minha gratidão se

estende a vo ês, que emmuito meagregaram aolongo desses anos. Obrigado por todoo

bom humor e enorme par eria. Zé e Lukas, vo ês são irmãos. Me sinto privilegiado por

poder onviver om pessoas tão espe iais.

Professor Mar elo, vo ê é fantásti o. Minha admiração por ti enquanto pessoa e

prossionalégrande. Foiumpresenteter meuTCCorientadoporvo ê, eagora olhemos

ofrutode um trabalhotão ex elente que exe utamos em onjunto. Obrigado porser tão

pa ientee fazerjus ao título de orientador.

Minhagratidãotambémnãopoderiadedeixardeexistirpara omosaten iosos

profes-soresdoDE, em espe ial aos quetiveoprivilégiode ursaralgumadis iplina. Professora

AnaFlávia,é até difí ilexpressar empou as palavraso sentimento que temosa respeito

dasenhora. A palavra obrigado,apesar de simples,traz um enormepeso de alegria em

poder ter ompartilhadovários momentos des ontraídos ao seu lado. Professor Hemílio,

vo ê foium paizão. Minhagratidãotambémse apli aaosenhor, quemedeu a

oportuni-dadede ser seu aluno projetistaPIBIC. Apesar de todaa di uldade,as liçõesextraídas

aolongo de dois anos de trabalhovaleram todoo esforço.

(7)

Aosamigosefamiliares,sintam-sein luídosnestaseçãode agrade imentos. Vo êssão

responsáveisporpartilharde momentosalegres e tristes, sempre om muito apoio. Deus

te abençoe Adelma, Alysson, Andreia, Arielly, Bárbara, Brenda, Carol, Chi o, Clarissa,

Cris, Douglas, Edgard, Ellen, Flávia, Flor, Gê, Gilvandro, Jéssi a, Jhon, João, Joy e,

(8)

mas transformai-vos pela renovação da mente,

a m de distinguir qual é a vontadede Deus:

o queé bom,o que Lhe é agradável, o queé perfeito.

(9)

A oletade informaçõesgeométri as,apartirdoavanço date nologia, eoestudodas

for-mas de objetostem se tornado ada vez mais omum eimportante. A análise estatísti a

de formas (AEF) utiliza métodos estatísti os para a análise de estruturas geométri as e

suasapli açõespodemseren ontradasemdiferentesáreasda iên ia. Noentanto,umdos

problemasde interessenaAEFéestender osmétodos lássi osde análiseestatísti a para

dadosde formas de objetos, oupropor novos métodos para esse tipode dado. Na AEFé

omum existir ane essidade de agrupamento emum onjuntode dados de modoa obter

grupos om ara terísti asmais homogêneas. Osmétodos de agrupamentosão

ferramen-tasúteis para explorar estruturas em onjuntos de dados sendo utilizados, por exemplo,

empara re onhe imentonão-supervisionadodepadrões. Ométodo

k

-médiasguraentre osmétodos de agrupamento mais antigos e mais omumente utilizadosna práti a. Mas,

apesar de sua simpli idadee e iên ia, oalgoritmo

k

-médiasapresentaalgumas de iên- ias. Por ausadisso,háane essidadedaproposiçãodemétodosalternativosquepossam

apresentarbonsresultados emsituaçõesondeoalgoritmo

k

-médiasfalha. Osmétodosde agrupamento espe tral surgem a partir de on eitos da teoria espe tral dos grafos onde

o problema de agrupamentoé ongurado omo um problema de orte nografo em que

uma função objetivo apropriada deve ser otimizada. Neste trabalho apresentamos uma

adaptaçãodo algoritmode agrupamento espe tral de Ng,Jordan & Weiss para dadosde

formasplanas de objetos eo omparamos auma adapataçãodoalgoritmo

k

-médiaspara dados de formas planas. Foram realizadas apli ações om 14 onjuntos de dados reais

e veri ou-se que o algoritmo espe tral adaptado de Ng, Jordan & Weiss, onsiderando

asdistân ias de pro rustes ompleta e eu lidiananoespaço tangenteobteve desempenho

superior aométodode agrupamento

k

-médias, forne endo evidên iasde que aadaptação proposta é e iente para dados dessa natureza.

Palavras- have: Agrupamento espe tral; Formas; Algoritmo de Ng, Jordan & Weiss;

(10)

Withthe advan e of te nology, the olle tionof geometri al informationfromimages

be ame usual. Statisti alshape analysis uses statisti al methodsto analyse geometri al

stru tures and an be applied in several areas. One parti ular problem of interest in

statisti alshape analysis is the adaptationof lassi al statisti almethods forshape data

orthepropositionofnewmethods. Instatisti alshapeanalysisitis ommonthe needfor

lustering shape data toobtain lusters with similar hara teristi s. Clustering methods

areusefultoolstoexplorestru turesindataandhavebeenused forunsupervisedpattern

re ognition. The

k

-means algorithmisamong theoldest and mostwidely used lustering methods. Despiteitssimpli ityande ien y,the

k

-meansalgorithmhassome problems. Be ause of this, it is important to propose alternate methods that an be useful where

the

k

-means fails. Spe tral lustering methods arise from spe tral theory of graphs and the lustering problem an be formulated as a graph ut where anappropriate obje tive

fun tion should be optimized. In this work we propose an adaptation of the Ng, Jordan

&Weiss spe tral lusteringalgorithmfor plannarshapedata. Weperformedappli ations

on 14 plannar shape data sets and veried that the adapted version of the Ng, Jordan

&Weiss algorithm onsidering the full pro rustesdistan e and the eu lidean distan e on

the shapes tangent spa e outperforms the version of the

k

-means algorithm for plannar shapes, orroboratingthat the proposed adaptation is e ient for shape data.

(11)

Lista de Figuras viii Lista de Tabelas ix 1 Introdução 1 1.1 Denição e Motivação . . . 1 1.2 Organização doTrabalho . . . 6 2 Referen ial Teóri o 7 2.1 Análise Estatísti ade Formas (AEF) . . . 7

2.1.1 Representação Matemáti a de Formas. . . 7

2.1.2 Distân ia Pro rustes para aso planar. . . 11

2.1.3 Coordenadas no Espaço Tangente . . . 14

2.2 Algoritmo

k

-médias para formas . . . 15

2.3 Funçõeskernel. . . 16

2.4 AgrupamentoEspe tral. . . 18

2.4.1 Algoritmo de Ng, Jordan &Weiss . . . 20

2.4.2 Agrupamento espe tralpara dados de formas . . . 21

3 Apli ações 23 3.1 Introdução . . . 23

3.1.1 Índi es de avaliação . . . 24

3.2 Apli ações . . . 26

3.2.1 Cérebros de esquizofrêni os e não-esquizofrêni os . . . 27

3.2.2 Vértebras de amundongos . . . 28

3.2.3 Crânios de gorilas . . . 29

3.2.4 Crânios de ma a os . . . 30

(12)

3.2.7 Crânios de himpanzés . . . 31

3.2.8 Crânios de orangotangos . . . 32

3.2.9 Grãos de areia. . . 32

3.2.10 Cabeças de salamandras . . . 33

3.2.11 Asas de mosquito . . . 34

3.2.12 Caudas de salamandras larvais. . . 34

3.2.13 Glumas de ereais . . . 35

3.2.14 Coraçõesdesenhados a mão . . . 35

4 Considerações Finais 36 4.1 Con lusões. . . 36

4.2 Trabalhos futuros . . . 37

Referên ias bibliográ as 38

(13)

1.1 Vértebra T2 de rato om 6 mar os matemáti os (junções de linhas) e 42

pseudo-mar os. . . 4

2.1 Congurações de um gorila ma ho. . . 10

2.2 A forma médiaPro rustes ompleta de gorilas ma hos e fêmeas. . . 12

(14)

1.1 Áreas do onhe imento ealgumas apli açõesda análiseformas. . . 2

3.1 Conjunto de dados utilizados no estudo, formato dos dados e número de

gruposde ada onjunto. . . 23

3.2 Parâmetros

σ

2

do kernel Gaussiano apli ados à ada onjuntos de dados

por meio doalgoritmoNg, Jordan &Weiss. . . 24

3.3 Matriz de onfusão. . . 25

3.4 Resumodosresultadosdasapli açõesapartirdosíndi esdeavaliaçãopara

ada distân ia onsiderada aos métodos utilizadosneste trabalho. . . 27

3.5 Taxa de Erro de Alo ação (TEA) e Índi e de Rand Ajustado (IRA)

ob-tidos pelos métodos de agrupamento onsiderados apli ados aos dados de

esquizofrêni os e não-esquizofrêni os. . . 28

vértebras T2 de amundongos. . . 29

3.7 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos

pelos métodosdeagrupamento onsideradosapli adosaosdadosde rânios

de gorilas. . . 29

de ma a os. . . 30

de grandes primatas. . . 31

(15)

de himpanzés. . . 32

de orangotangos. . . 32

pelos métodos de agrupamento onsiderados apli adosaos dados de grãos

de areia. . . 33

pelosmétodosdeagrupamento onsideradosapli adosaosdadosde abeças

de salamandras. . . 33

pelos métodos de agrupamento onsiderados apli ados aos dados de asas

de mosquito.. . . 34

pelos métodos deagrupamento onsideradosapli adosaosdadosde audas

de salamandraslarvais. . . 34

pelos métodosdeagrupamento onsideradosapli adosaosdadosdeglumas

de ereais. . . 35

(16)

INTRODUÇO

1.1 Denição e Motivação

Objetos, sejamelesnaturaisouarti iais,podemseren ontradosportodaparte. Com

o avanço da te nologia, a oleta de informações geométri as tem se tornado rotina e o

estudoda formade objetostem se tornado ada vez mais importante(DRYDEN;

MAR-DIA,1998). Aanálise estatísti a de formas (AEF) éuma área de pesquisa relativamente

nova, que apli a métodos estatísti os para a análise de estruturas geométri as. Em um

sentido amplo, aformulaçãomatemáti a da AEFé semelhanteà análise estatísti a

mul-tivariada. Apli açõesdaAEF podem ser en ontradas emdiferentes áreas da iên ia. Em

visão omputa ional, asformasdas fronteiras emimagenstêm umimportantepapel. Em

medi ina, a análise daforma de dados anatmi os pode ajudar no diagnósti o de

diver-sasdoenças. As formas de ara tereses ritos podem ser usadas omo meios primáriosde

identi ação. Embiometriahumana,aidenti açãodepessoasatravésdesuasdigitaisou

es aneamento fa ialsão exemplos de análise de formas. A Tabela1.1 apresenta algumas

apli açõesonde a análisede formas pode ser impres indível(COSTA; JR, 2000).

O trabalho seminal The diusion of shape em análise de formas foi publi ado em

1977, por David Kendall, e apresenta um breve resumo no qual é introduzida uma nova

representação deformas deobjetosemespaços omplexosprojetados (KENDALL,1977).

Alguns anos depois,Kendall (1984) deniu forma omo toda informaçãogeométri a que

resta quando os efeitos de tamanho, rotação e es ala são retiradas de um objeto.

Ken-dalltambém props um sistema de oordenadas om nalidade de obter a forma de um

objeto através de pontos dispostos em seu ontorno hamados de mar osanatmi os. A

(17)

Tabela1.1: Áreas do onhe imentoe algumasapli açõesdaanálise formas.

Área do Conhe imento Exemplo de Apli ações

Neuro iên ia Taxonomia morfológi a de neurnios,

in-vestigaçõessobrearelaçãofunçãoeforma

das élulas, omparação entre élulas de

diferentes áreas orti ais e de diferentes

espé ies, modelagem de élulas

biologi a-mente realistas.

Análise de Do umentos Análisededo umentoseletrni os

(textu-aisouvisuais) omo emapli açõesCBIR,

sistemas OCR (Opti al Chara ter

Re og-nitions), análise de dados em ban o de

dadosmultimídia.

Artes Visuais Restauração de vídeo, efeitos espe iais,

monitoramentode vídeo, jogos,

omputa-ção grá a,síntese de imagens.

Medi ina Identi ação de tumor, quanti ação de

mudança e deformação de estruturas

anatmi as, análise numéri a de

romos-somos, identi açãode doençasgenéti as.

Biologia Identi açãode espé ies,taxonomia,

rela-ção entre forma efunção, omparativo de

anatomias, itologia, identi ação e

on-tagem de élulas ( omo glóbulos bran os

nosangue), ara terizaçãode élulase

for-mas nu leares, res imento e modi ação

de formas de estruturas, análise daforma

de aminhar dos seres vivos.

Físi a Apli ações envolvendo mi ros opia omo

a análise da trajetória, omportamento e

distribuiçãode partí ulas em um meio ou

material,análisede estruturas omo

polí-meros e ristais, ara terização de grupos

de estrelas ou análise de propriedades de

orpos elestes emastronomia, análise do

movimento de objetos ma ros ópi os

(ve-lo idade,a eleração, et .).

Engenharia Controle visual de qualidade de produtos

emlinha de produção,dete ção de perigo,

interpretação (pelas máquinas) de

dese-nhos feitos à mão, automação, robóti a,

sensoriamentoremoto.

Segurança Dete ção de impressão digital, fa e e íris,

veri ação de assinaturaemodode andar

de uma pessoa (biometria).

Agri ultura Controle de olheita, ontagem de

(18)

eBookstein (1986).

Apesardeanálisedeformaspoderserinvestigadaatravésdemétodosmatemáti os

tra-di ionais(ROHLF; BOOKSTEIN, 1990), háum interesse emrealizar omparação direta

daforma dos organismos (MARE; CORSEUIL, 2004). A utilização de mar os

anatmi- osé umdesses métodosde omparaçãodireta,usado pararepresentarasformas de uma

maneira ompreensivapormeiode dadosnuméri osmédios. Osdadospodemser obtidos

através de oordenadas médias de mar os distribuídosperiferi amente, oudentrodas

es-truturasanalisadas, oudas distân ias entre os mar osanatmi oses olhidos diretamente

para adaespé ie.

Ummar oéum pontode orrespondên iaem ada objetoque oin ideentre edentro

das populações ou grupos, ou seja, todos os objetos possuem os mesmos mar os. Um

mar oanatmi o,porsuavez,éumpontoatribuídoporum espe ialista,que orresponde

entre organismos, de algumaforma biologi amentesigni ativa,por exemplo,o antode

um olho oua reuniãode duas suturasemum rânio. Já mar osmatemáti os são pontos

lo alizadosnum objeto de a ordo omalgumapropriedade matemáti aougeométri ada

imagem, por exemplo, pontos de alta urvatura ou pontos extremos. Por m,

pseudo-mar os são pontos onstruídos emum objeto, lo alizados aoredor do ontorno ou entre

mar osanatmi osoumatemáti os. Nagura1.1vemos6mar osmatemáti osempontos

de alta urvatura e 42 pseudo-mar os mar ados no ontorno de uma segunda vértebra

torá i a (T2) de rato. Os mar os ainda podem ser denidos em três tipos adi ionais,

onde osmar os do tipoI o orrem najunção de te idos/ossos; os dotipo II são denidos

por propriedades lo ais, tais omo urvaturas máximas e os mar os do tipo III o orrem

(19)

Figura 1.1: Vértebra T2 de rato om 6 mar os matemáti os (junções de linhas) e 42

pseudo-mar os.

Fonte: DrydeneMardia(1998).

Um dos problemas de interesse em AEF é estender métodos lássi os de análise

es-tatísti a para dados de formas de objetos ou propr novos métodos para este tipo de

dado.

É omumexistir,emanálisedeformas,ane essidadedeagrupamentoemum onjunto

de dados, de tal forma que se obtenha grupos om ara terísti as mais homogêneas.

Por exemplo, quando se deseja dete tar o número de diferentes espé ies, a análise de

agrupamento pode ser um ex elente re urso para dete ção dos grupos(AMARAL etal.,

2010). Dessa forma, diversos pesquisadores têm onduzido estudos e têm estudado a

performan e desses métodos.

Osmétodosdeagrupamentosãoferramentasúteisparaexplorarestruturasem

onjun-tosde dados sendo utilizados, por exemplo,em para re onhe imentonão-supervisionado

de padrões. A tarefa de agrupar signi a organizar um onjunto de observações

(indi-víduos, objetos, et .) em grupos de tal forma que observações perten entes a um dado

grupo têm um alto grau de similaridade, enquanto que observações perten entes a

gru-pos diferentes têm um alto grau de dissimilaridade (GORDON, 1999; JAIN; MURTY;

(20)

emdiversasáreasda iên ia,tais omo,taxonomia,pro essamentode imagens,mineração

de dados, re uperação de informação,dentre outras.

As té ni as de agrupamento mais populares podem ser divididas em métodos

hierár-qui osemétodosparti ionais. Osmétodoshierárqui osproduzemumaresposta

represen-tadaporumaestrutura ompletadehierarquia,i.e.,umasequên iaaninhadadepartições

do onjuntode observações de entrada; sua saída é uma estrutura hierárqui ade grupos

onhe ida omodendrograma. Poroutrolado,nosmétodosparti ionaisoobjetivoéobter

umapartiçãoúni ado onjuntodeobservaçõesemumnúmeroxodegrupos,tipi amente

através daotimização (geralmente lo al) de uma funçãoobjetivo;o resultado é a riação

de hipersuperfí ies de separação entre os grupos.

Os métodos de agrupamento parti ionais foramdesenvolvidos sob dois diferentes

pa-radigmas: agrupamento rígido (hard) e agrupamento difuso (fuzzy). Nos métodos de

agrupamento do tipo rígido, os grupos são naturalmente disjuntos e não se sobrepõem.

Nesse aso, adapadrãopodeperten eraum,esomenteum,grupo. No asodosmétodos

deagrupamentodotipodifuso,umpadrãopodeperten eratodososgrupos omum erto

grau de pertinên ia. Uma exposição detalhada dos prin ipais métodos de agrupamento

difuso pode ser en ontrada em Höppner (1999). Em adição, uma boa revisão sobre os

vários métodos de agrupamento pode ser en ontrada, por exemplo, em Jain (2010) ou

em Jain, Murty e Flynn (1999).

Ométodo

k

-médias(HARTIGAN;WONG,1979) gura entre osmétodos de agrupa-mento mais antigos e mais utilizados em problemas práti os (JAIN, 2010). Tal método

onsistenadivisão de um onjuntode observaçõessobreum espaçométri oem

k

grupos, de maneira que a soma dos quadrados das distân ias entre ada observação e a média

do grupo ao qual ela perten e seja a mínima possível. Esta divisão é, em geral, obtida

por meio de algoritmos iterativos. Amaral et al. (2010) propuseram uma adaptação do

método

k

-médias lássi opara dadosde formas planas (bidimensionais)de objetos. Eles onsideraram três tipos de distân ias apropriadas para dados de formas, além de uma

versão dométodobaseado nadistân iaEu lidiana lássi a obtidanoespaçotangentedas

formas. Apesar de sua simpli idade ee iên ia, o algoritmo

k

-médias apresentaalgumas de iên ias. Por essa razão, surge a ne essidade da proposição de métodos alternativos,

quepossam apresentar bons resultados em situações ondeo algoritmo

k

-médiasfalha. Osmétodosdeagrupamentoespe tralsurgemde on eitosdateoriaespe traldos

gra-foseoagrupamentoé ongurado omoumproblemade podanografo,ondeumafunção

objetivo apropriada deve ser otimizada. A ideia bási a é onstruir um grafo ponderado

a partir do onjunto de dados ini ial, onde ada nó representa uma observação e ada

(21)

observa-ções. A ideia prin ipal desta teoria é a de omposição espe tral da matriz lapla ianado

grafoponderado obtido apartir dos dados originais(FILIPPONE et al.,2008). Verma e

Meila(2003),Kannan, VempalaeVetta (2004),Shawe-Taylor eKandola(2001)

apresen-tam omparações entre diversos métodos de agrupamento espe tral e métodos lássi os

deagrupamento,enquantoLuxburg(2007)apresentaum tutorialsobremétodosde

agru-pamentoespe tral.

Neste trabalho apresentaremos uma adaptação do algoritmo de agrupamento

espe -tralde Ng, Jordan e Weiss (NG; JORDAN; WEISS, 2001) para dados de formas planas

de objetos. Partiremos da denição de funções kernel adequadas para dados de

for-mas(JAYASUMANA etal.,2013), introduzindoum algoritmode agrupamentoespe tral

adequadoparadados de formase umalgoritmode agrupamentoespe tral noespaço

tan-gente das formas. Apli ações om onjuntos de dados reais irão ilustras a utilidade dos

métodos propostos.

1.2 Organização do Trabalho

Alémdo apítulode introdução,estetrabalhoé ompostopormais três apítulos. No

Capítulo2 apresentamos uma revisão geral sobre Análise Estatísti a de Formas, emque

introduzindo uma representação matemáti a de formas seguido de subseções ontendo

informações a er a da distân ia de pro rustes para aso planar, oordenadas no espaço

tangente, além de apresentarmos oalgoritmo

k

-médiapara dados de formas e uma seção expli andoasfunçõeskernel. Aindaneste apítulo,éfeitaumarevisãosobreagrupamento

espe tral e o algoritmoespe tral de Ng, Jordan & Weiss. Finalizaremoso apítulo om

umaseção ontendonossapropostadetrabalho. NoCapítulo3,índi esdeavaliaçãoserão

utilizadosem onjuntosdedadosreais,objetivando-semensurarae á iadosalgoritmos.

Finalmente, no Capítulo4, são apresentadas as onsiderações nais a er ado trabalhoe

(22)

REFERENCIAL TEÓRICO

2.1 Análise Estatísti a de Formas (AEF)

Nesta seção, apresentaremos uma revisão geral sobre AEF, introduzindo uma

repre-sentaçãomatemáti adessetipodeanálise,emque on eitosbási ospara ompreensãoda

teoriaabordadaserãodenidos;seguidodas expli açõesparaoentendimentodadistân ia

de pro rustespara o aso planar e estudode oordenadas noespaço tangente.

2.1.1 Representação Matemáti a de Formas

Aespe i açãodeum sistemade oordenadaséessen ialparades riçãosobreaforma

de um objeto. São vários os sistemas de oordenadas: oordenadas de Bookstein,

pro-postas por Bookstein (1984, 1986); oordenadas polares de Kent, proposta por Kent

(1994); oordenadas de forma Goodall-Mardia QR desenvolvida por Goodall e Mardia

(1992, 1993); e entre outras, as oordenadas de Kendall podem ser vistas em Dryden e

Mardia(1998). Umaes olhaapropriada dosistemade oordenadas para formas deveser

invariantesob lo ação,es ala e rotaçãoda onguração.

Uma onguração é um onjunto de mar os em um objeto parti ular. Uma

ongu-ração matemáti a

X

é representada por uma matriz

k × m

de oordenadas artesianas de

k

mar osem

m

dimensões. Oespaçoda onguraçãoéoespaçode todas oordenadas

(23)

possíveis dos mar os.

X

=







x

1,1

· · · x

1,m

x

2,1

· · · x

2,m

. . . . . . . . .

x

k,1

· · · x

k,m







(2.1)

Serão onsiderados os asos onde

k ≥ 3

e

m = 2

, oque orresponde asformas planas. Assima matrizde onguração

X

daexpressão (2.1) resume-se a

X

= [x

1 x

2 ]

⊤

=







x

1,1

x

1,2

x

2,1

x

2,2

. . . . . .

x

k,1

x

k,2







(2.2)

Algumas transformações devem ser feitas na matriz

X

para remover os efeitos de lo ação,es alaerotação. Para

m =

2,a onguraçãomatemáti adeveserrees rita omo um vetor omplexo. Dena um vetor omplexo (

k × 1

) talque

z

0 = (z

0 ₁

, . . . , z

_k

0 )

⊤

= (x

1,1

+ ix

1,2

, . . . , x

k,1

+ ix

k,2

)

⊤

(2.3)

oqual orresponde as oordenadas omplexas para osmar os.

Neste trabalho serão onsideradas as oordenadas de Kendall. O primeiro

traba-lho feito nesta área foi Kendall (1977), mas somente em Kendall (1984) que realmente

formalizou-seedeniu-seos on eitosbási os. Umdospontosmaisrelevantesdotrabalho

deKendallfoiapropostadosistemade oordenadas. Estessistemasvisamaobtençãoda

formade um objeto por meio dos pontos dispostos através dos mar os. Primeiramente,

deve-se retirar os efeitos de lo ação. Contudo, para remover a lo ação daforma deve-se

denirasubmatrizde Helmert(

H

). Amatrizde Helmert(

H

F

)éumamatrizquadráti a

ortogonal

k × k

omaprimeiralinhadeelementos iguala

1/

√

k

,então a

j

-ésimalinha(

j

-1)elementosiguaisa

1/

pj(j − 1)

seguidoporumelementoiguala

(j − 1) × 1/pj(j − 1)

e

(k − j)

zeros. A sub-matriz de Helmert é a matriz de Helmert sem a primeira linha. Por exemplo,para

k

=4 amatriz de Helmert é

H

F

=







1/2

−1/

√

2 1/

√

2

0

0 −1/

√

6 _−1/

√

6 2/

√

6

0 −1/

√

12 −1/

√

12 −1/

√

12 3/

√

12 





(24)

ea sub-matriz de Helmert será

H

=







−1/

√

2 1/

√

2

0

0 −1/

√

6 _−1/

√

6 2/

√

6

0 −1/

√

12 −1/

√

12 −1/

√

12 3/

√

12 





Para remover a lo ação do vetor omplexo

z

0

, basta multipli ar o vetor pela

sub-matriz de Helmert (

H

) de dimensão

(k − 1) × k

. A onguração Helmertizada é dada por

w

(k−1×1)

= H

(k−1×k)

z

(k×1)

0

(2.4)

onde

w

representa a onguração

z

0

sem o efeitode lo ação.

Pode-se reverter de volta aos mar os entrados de um mar o Helmertizado por

pré-multipli arpor

H

⊤

, omo

H

⊤

H

=

I

k

−

1 k

1 ⊤

k

Dessa forma,pré multipli ando ovetor

w

por

H

⊤

obtém-se a onguração entrada

H

⊤

w

= H

⊤

Hz

0 =

I

k

−

1 k

1 ⊤

k

z

0 = z

0 ₋

1 k

k

X

j=1

z

_(j)

0

1 _k

(2.5)

Paraexempli ar,tem-sea onguraçãomatemáti adeumindivíduoobtidodosdados

degorilasma hos,(DRYDEN;MARDIA,1998),emque

z

0 _{= (53+220i, 46−35i, 0+0i, 0+}

37i, 12 + 122i, 58 + 204i, 93 + 117i, 103 + 28i)

⊤

. A Figura2.1representaas ongurações

original, Helmertizada e entralizada para mar os de um gorila ma ho. Vale notar que

a onguração Helmertizada, Figura 2.1b, perde a dimensão original dos dados. Este

problema é orrigido om amultipli ação por

H

⊤

(25)

Figura 2.1: Congurações de um gorila ma ho.

Fonte: Oliveira(2016).

Para removeroefeitode es aladeve-se dividira onguraçãoHelmertizada,obtidana

expressão(2.4), pela sua norma. Sendo assim,

z

k−1×1

=

w

|w|

=

w

√

w

∗

_w

=

H

(k−1×k)

z

_(k×1)

0 q

(H

(k−1×k)

z

0 _(k×1)

)

∗

(H

(k−1×k)

z

_(k×1)

0 )

(2.6) onde

w

∗

éo transposto do onjugadode

w

e|

·

| denotaanorma omplexa de

w

. Ovetor

z

, de a ordo om Kendall(1984), é hamadode pré-forma da onguração omplexa

z

0

.

Éimportantenotar que apré-forma éuma forma om oefeito de rotaçãoretido.

Devido a importân ia da pré-forma no estudo das oordenadas de Kendall, alguns

on eitos relevantes devemser onsiderados.

Denição2.1. (Pré-forma). Aspré-formasdeuma matrizde onguração

X

, da Equa-ção (2.1), é dado por

z

k−1×m

=

H

(k−1×k)

X

(k×m)

|HX|

(2.7)

o qual é invariante sob lo ação e es alada onguração original.

A partirdaEquação (2.7)pode-seobter aspré-formas entralizadasde formaque

z

C

e

(k×m)

= C

e·(k×k)

X

k×m

/|C

e

X

|

desde que

C

e

= H

⊤

_H

. Note que

z

é uma matriz

(k − 1) × m

enquanto que

z

c

e

é

uma matriz

k × m

. A vantagem em usar

z

é por ser de posto ompleto e sua dimensão é menor do que de

z

c

e

. Em ontrapartida, há uma vantagem de trabalhar om a

pré-forma entralizada

z

c

e

,pois arepresentação das oordenadas Cartesianasé oerente om

(26)

O espaço das pré-formas é o espaço de todas as possíveis pré-formas

z

, ou seja, o espaço de todos os possíveis vetores de dimensão

(k − 1)

que não possuem a informação dalo ação e es ala. Para pré-formas planas, este espaço é uma hiperesfera omplexa de

dimensão

(k − 1)

,isto é

C

_S

k−2

_{= {z : z}

∗

_z

_{= 1, z ∈ C}

k−1

_}

(2.8)

emque

C

k−1

é o espaço ompleto de dimensão

(k − 1)

.

Denição2.2. (Forma). Aforma deumamatriz de onguraçãoX étodaa informação

geométri a sobre X que é invariante sobre lo ação, rotação e es ala. A forma pode ser

representada omo

[z] = {e

iθ

z

_{: θ ∈ [0, 2π)}}

(2.9)

emque

θ

é o grupo espe ial ortogonalde rotações e z é a pré-formade X.

Para

m = 2

oespaçodaformaéespaçoprojetivo omplexo

C

P

k−2

,oespaçode linhas

omplexasque passampelaorigem.

Denição 2.3. (Í one). Um í one é um membro parti ular do onjunto de formas [

z

℄ o qual é tomado omo sendo a representatividade da forma.

Apalavraí oneindi aimagemousemelhança eéapropriado omousopararetratar

umaimagemrepresentativadeuma lasseequivalentedaformaoqualpossui`semelhança'

paraoutrosmembros,istoé,osobjetosda lassesãotodossimilares. Apré-forma entrada

z

c

e

é uma es olha apropriada de í one. Dessa forma, iremos usar a pré-forma entrada para ter uma representação da onguraçãooriginal.

2.1.2 Distân ia Pro rustes para aso planar

Oobjetivo desta seçãoé apresentaralguns on eitos bási os paraamostras aleatórias

de objetos. Alguns desses aspe tos de análise de formasão: obter aestimativa da forma

médiadeumaamostraaleatória,o ál ulode distân iasentre formas, osresíduosde ada

objeto emrelaçãoa um grupo.

Umimportante on eitode análisede formaéestimaraformamédiade umaamostra

aleatóriade ongurações. Considere

z

0

1 , . . . , z

0 n

omo uma amostraaleatóriade ongu-rações omplexasdeumapopulaçãode

n

objetosouindivíduosoqual

z

0 i

foidenidopela Equação (2.3).

(27)

De a ordo om Kent (1994) obtém-se o seguinte resultado para estimação da forma

média Pro rustes ompleta

µ

ˆ

para formas planas.

Resultado 2.1. A forma média Pro rustes ompleta

µ

ˆ

pode ser en ontrada omo o autovetor orrespondenteao maior autovalor da soma quadráti a omplexa e matriz

produto

S

=

n

X

i=1

w

i

w

∗

i

/(w

i

∗

w

i

) =

n

X

i=1

z

i

z

∗

i

,

(2.10)

onde

z

i

= w

i

/||w

i

||, i = 1, . . . , n

são as pré-formas.

Assim,

µ

ˆ

é dado pelo autovetor omplexo orrespondente ao maior autovalor, ou autovetor dominantede

S

. O autovetor é úni o (até uma rotação- todas rotaçõesde

µ

ˆ

são também soluções, mas todos este orrespondem a mesma forma), desde que exista

um úni o autovalor maior de

S

. A forma média de dados dos gorilas 29 ma hos e 30 fêmeas (DRYDEN; MARDIA, 1998)são apresentados naFigura2.2.

Figura2.2: A formamédia Pro rustes ompleta de gorilasma hos e fêmeas.

A onguração possui uma rotação arbitrária (DRYDEN; MARDIA, 1998). Assim,

é ne essário rota ionar todas ongurações de tal forma que eles estarão tão próximos

quantopossíveldaformamédiaamostral. Dessaforma,dene-se queoajuste

Pro rus-tes ompleto ou oordenadas Pro rustes ompletade

w

1 , . . . , w

n

são

w

P

_i

=

w

∗

i

µw

ˆ

i

w

∗

_i

w

i

(28)

onde ada

w

P

i

é o ajuste Pro rustes ompleto de

w

i

em

µ

ˆ

. A forma média Pro rus-tes ompleta pode ser obtida por tomar a média aritméti a das oordenadas Pro rustes

ompleta, ouseja,

1 n

P

n

i=1

w

i

P

tem a mesmaforma omo a formamédia Pro rustes

µ

ˆ

.

Osresíduos Pro rustes são al ulados omo

r

i

= w

i

P

−

1 n

n

X

i=1

w

_i

P

!

, i = 1, . . . , n

(2.11)

eos resíduosPro rustes são usados para investigar avariabilidadeda forma.

Um on eito de distân iaentre duas formas é ne essário para denir ompletamente

oespaço métri ode formanão-Eu lidiana.

Considere duas matrizes de onguração

k

pontose dimensão

m

=2,

X

e

Y

, esuas ongurações entradase de tamanhounitário(pré-forma entrada)

z

x

= (z

x1

, . . . , z

xk

)

⊤

e

z

y

= (z

y1

, . . . , z

yk

)

⊤

,de duas ongurações

X

e

Y

onde

||z

x

|| = 1 = ||z

y

||

e

z

∗

x

1 k

= 0 =

z

∗

y

1 k

. Dessa forma,adistân ia de Pro rustes ompletaentre duas formas

z

x

e

z

y

é

d

2 _F

_{= 1 − |z}

∗

_x

z

y

|

2

(2.12)

Esta distân ia é invariante aos efeitos de lo ação, es ala e rotação. Consequentemente,

podemos onsiderar

cos ρ = (1 − d

2 F

)

1/2

.

Paradadosnoplano,oespaçopré-formaéumaesfera omplexa

C

S

k−2

deraiounitário

em dimensão omplexa

k − 1

denido na Equação (2.8). O ângulo entre as pré-formas omplexas

z

x

e

z

y

é

ρ = arccos(|z

x

∗

z

y

|)

(2.13)

Essa quantidade também denominada omo geodési a é denida omo o aminho mais

urtoentre

z

x

e

z

y

nahiperesferadapré-formaenão éafetadapelarotação(ZELDITCH; SWIDERSKI; SHEETS, 2012). Consequentemente, pode-se ver expli itamente que a

distân ia de Pro rustes

ρ

éo ânguloentre aspré-formas

z

x

e

z

y

. Também, desdeque o raio da esfera da pré-forma é 1, pode-se onsiderar

ρ

a distân ia ótima no ír ulo na esfera dapré-forma.

Adistân ia de Pro rustes Par ialtambéméinvariantequantoarotaçãoentre

z

x

e

z

y

eé dada por

d

2 _P

_{= 2(1 − |z}

_x

∗

z

y

|) = 2(1 − cos ρ)

(2.14)

(29)

pré-forma.

Figura2.3: Ilustração darelação entre as distân ias

d

F

,

ρ

e

d

P

naesfera dapré-forma.

2.1.3 Coordenadas no Espaço Tangente

O espaço tangente éa versão linearizada do espaço de formas naproximidade de um

pontoparti ulardoespaçodeforma. Umadasvantagensdoespaçotangenteéquepodem

ser usadas asté ni as padrão de análise multivariada. Existem vários tiposdiferentes de

oordenadasnoespaço tangente. Serão onsideradasas oordenadas tangentePro rustes

par ial.

Considere

x

1 , . . . , x

n

uma amostra de ongurações. Dessa forma, as oordenadas tangentes serão

t

i

= exp

iθ

[I

k−1

− ˆ

µ

ˆ

∗

]z

i

, i = 1, . . . , n

(2.15)

onde

z

i

é a pré-forma orrespondente a onguração

x

i

denida em (2.7),

θ

ˆ

minimiza

|| ˆ

µ

_{− z exp}

iθ

_||

2

e

||z|| =

√

z

∗

_z

.

Suponhaque

z

1 , . . . , z

n

éuma amostraaleatória de pré-formase

t

1 , . . . , t

n

suas oor-denadas tangentes. Seja

v

i

um vetor

2k − 2

o qualéobtido porempilharas oordenadas real eimagináriade ada

t

i

. Essa operação érepresentada por

cvec

onde

(30)

Assim, o vetor de pré-formas

z

i

∈ C

k−1

é representado nas oordenadas tangentes

pelo vetor

v

i

∈ R

2k−2

. A distân ia Eu lidiana no espaço tangente para o espaço de

formas é uma boa aproximação para situações de alta on entração, ou seja, variân ia

pequena ((DRYDEN; MARDIA, 1998), p.76) das distân ias de Pro rustes

d

F

, ρ

e

d

P

. E assim,pode-se apli aros métodos multivariadospadrõesnas oordenadastangentes.

As oordenadas tangentes par ial possuem grande utilidade nas análises de formas,

umavez quepode-seutilizarasdiversasté ni asmultivariadasnoespaçoEu lidiano.

En-tretanto,pesquisadores já mostraram sua ine iên ia em dados om baixa on entração.

Como por exemplo, os testes de hipóteses das formas médias das pré-formas propostas

porAmaral, DrydeneWood(2007)earegiãode onançabootstrapparaaformamédia

planar,desenvolvida porAmaral et al.(2010).

2.2 Algoritmo

k

-médias para formas

Dea ordo omAmaraletal.(2010),paradadosusuais,oalgoritmo

k

-médiasobjetiva parti ionar

n

observaçõesdentre

k

gruposdemodoque adaobservaçãopertençaaogrupo ujadistân iaentre essa observação e oprotótipo(representante) dogrupoé mínima. O

termo

k

-means foi usado primeiramente em 1967 por James Ma Queen em seu artigo intitulado Some Methods for Classi ation and Analysis of Multivariate Observation.

Noanode1957,SturatLlodypropsoalgoritmoStandardAlgorithm omoumaté ni a

de modulação de pulso que não tinha sido publi ado fora dos laboratórios Bell até 1982.

Oalgoritmoé onhe ido omoLlody Forgypoisem1965 E.W. Fordypubli ouomesmo

algoritmo. Entre 1975 e 1979, uma versão mais e iente foi proposta e publi ada em

Fortranpor Hastigan eWong.

Seja um onjunto de

n

objetos ou indivíduos a ser agrupados em um onjunto de

k

grupos,

C = (C

r

, r = 1, . . . , k)

. Oalgoritmo

k

-médiasen ontraumapartiçãominimizando um ritérioquemededistân iaentrepré-formasdegruposeformasmédia(Formamédia

Pro rustes ompleta).

J(C

r

) =

X

i∈C

r

d

2 (z

i

, µ

r

)

ondeafunção

d

2

éumamedidade distân iageral omoasdistân ias denidasem(2.12),

(31)

Oobjetivo do

k

-médias éminimizara soma doerro quadráti o sobre todo luster

k

,

J(C) =

k

X

r=1

X

i∈C

r

d

2 (z

i

, µ

r

)

(2.16)

Oalgoritmoa seguir resumeo passoa passo iterativopara obter oagrupamentopelo

método

k

-médias emanálise de formas.

Algoritmo 1:Método de Agrupamento

k

-médias para formas planas Entrada: Pré-forma

z

( omo denido na Equação (2.6)),número de grupos

k

e

alo ação ini ial;

Saída: Grupos

C

r

(1 ≤ r ≤ k)

;

1 Obtenha a formamédia para ada grupo;

2 Atribua ada objetoa formamédia dogrupomais próximo, através das Equações

(2.12),(2.13) ou(2.14);

3 Cal ulea formamédia de ada grupo;

4 Repita opasso 2 e 3até quea formamédia não mude ouum valorótimo da

Equação (2.16)seja en ontrada.

Esse algoritmo move os objetos entre os agrupamentos até que não haja alteração

signi ativanafunçãoobjetivo,ouatéqueonúmerodeiteraçõesmáximoprédeterminado

sejaal ançado. Oresultado é um onjuntode grupos om indivíduos om ara terísti as

homogêneasdentrodos grupos e om ara terísti as heterogêneas entre osgrupos.

Apesardoalgoritmo onvergirrapidamenteparaumasolução,essasoluçãoen ontrada

depende daalo açãoini ial, logoo métodopode onvergir paraum ótimo lo al. Trata-se

de um métodopráti oe omputa ionalmentee iente, porémé sensívela ruído epontos

aberrantes, porexemplo.

2.3 Funções kernel

Desde o iní io da última dé ada, muitos pesquisadores têm demonstrado interesse

em métodos baseados emkernel (FILIPPONE et al., 2008). A prin ipal ideia por trás

desses métodos é o uso de um mapeamento não-linear arbitrário

Φ

do espaço original dasobservaçõespara umespaço demais altadimensão (possivelmenteinnita), hamado

espaço de ara terísti as,

F

. Nesta seção, apresentamos uma breve revisão a er a da teoriabási a sobre funções kernel.

(32)

Seja

X

= {x

1 , . . . , x

n

}

um onjunto não-vazio, onde

x

i

∈ R

p

,

∀i

. Uma função

h :

X

_{× X → R}

édita um kernel positivo-denido (ou kernel de Mer er) se, e somente se,

h

é simétri a(isto é,

h(x

i

, x

k

) = h(x

k

, x

i

)

) e a seguintedesigualdade é válida (MERCER, 1909):

n

X

i=1

n

X

k=1

c

i

c

k

h(x

i

, x

k

) ≥ 0 ∀n ≥ 2,

(2.17) onde

c

r

∈ R ∀r = 1, . . . , n

.

Um onjunto de observações não-linearmenteseparável pode tornar-se separável

line-armente através de um mapeamento não-linear arbitráriopara um espaço de

ara terís-ti as de alta dimensão (HAYKIN, 1998). Seja

Φ : X → F

um mapeamento não-linear arbitrário do espaço original das observações para um espaço de ara terísti as de alta

dimensão

F

. Apli andoo mapeamentonão-linear

Φ

, oproduto interno

x

⊤

i

x

k

no espaço originalémapeado para

Φ(x

i

)

⊤

_Φ(x

k

)

noespaçode ara terísti as. A essên ia dos méto-dos baseados em kernel é que o mapeamentonão-linear

Φ

não pre isaser expli itamente espe i ado porque todo kernel de Mer er pode ser expresso omo

h(x

i

, x

k

) = Φ(x

i

)

⊤

Φ(x

k

),

(2.18)

queé usualmentereferida omo kernel tri k.

Por ausa da Equação (2.18), é possível al ular distân ias Eu lidianas em

F

da seguintemaneira:

||Φ(x

i

) − Φ(x

k

)||

2 = (Φ(x

i

) − Φ(x

k

))

⊤

(Φ(x

i

) − Φ(x

k

))

= Φ(x

i

)

⊤

Φ(x

i

) − 2Φ(x

i

)

⊤

Φ(x

k

) + Φ(x

k

)

⊤

Φ(x

k

)

= h(x

i

, x

i

) − 2h(x

i

, x

k

) + h(x

k

, x

k

).

(2.19)

Exemplos de funções kernel tipi amenteutilizadas são:

•

Linear:

h(x

i

, x

k

) = x

⊤

i

x

k

,

•

Polinomialde grau

d

:

h(x

i

, x

k

) = (γx

⊤

i

x

k

+ θ)

d

,

γ > 0

,

θ ≥ 0

,

d ∈ N

,

•

Gaussiana:

h(x

i

, x

k

) = e

−

||xi−xk||2

2σ2

,

σ > 0

,

•

Lapla iana:

h(x

i

, x

k

) = e

−γ||x

i

−x

k

||

,

γ > 0

,

•

Sigmóide:

h(x

i

, x

k

) = tanh(γx

⊤

i

x

k

+ θ)

,

γ > 0

,

θ ≥ 0

,

(33)

2.4 Agrupamento Espe tral

Osmétodos de agrupamentoespe tral rela ionam-se om teoria dos grafos(SHA

WE-TAYLOR; KANDOLA, 2001). Uma omparação de alguns métodos de agrupamento

es-pe tral foi apresentada por Verma eMeila (2003). Seja

X

= {x

1 , . . . , x

n

}

o onjuntode obervaçõesaseremagrupadas. Ini iandoapartirde

X

,podemos onstruirumgrafo om-pleto,ponderadonão-dire ionado

G(V, A)

ontendoum onjuntode nós

V = {v

1 , . . . , v

n

}

orrespondendo às

n

observações e arestas denidas através da matriz de adja ên ia

A

(também hamada de anidade), de dimensão

n × n

. A matriz de adja ên ia para um grafoponderado édada pelamatriz ujoelemento

a

ij

representa opesodaarestaqueliga os nós

i

e

j

. Sendo um grá o não-dire ionado, a propriedade

a

ij

=

a

ji

é verdadeira. A adja ên iaentre duas observações pode ser denida daseguinteforma:

a

ij

=







h(x

i

, x

j

),

se

i 6= j;

0,

aso ontrário

.

(2.20)

onde a função

h(x

i

, x

j

)

mede a similaridade entre duas observações

i

e

j

. Comumente, umafunção kernel gaussiana éusada:

h(x

i

, x

j

) = exp

−

d

2 _(x

i

, x

j

)

2σ

2 ,

(2.21) onde

d

2 _(x

i

, x

j

) = ||x

i

− x

j

||

2

mede a dissimilaridade entre duas observações

i

e

j

e

σ

2

ontrola a velo idade de deterioraçãode

h

. Esta parti ular es olha tem apropriedadede que

A

tem apenas algunstermos signi ativamentediferentes de

0

,ouseja,

A

éesparsa. A matrizde grau

D

é amatriz diagonal ujos elementossão osgraus dos nós de

G

,

d

ii

=

n

X

j=1

a

ij

.

(2.22)

Neste ontexto, o problema de agrupamentopode ser visto omo um problema de orte

(CHUNG,1996), ondese deseja separar um onjunto de nós

S ⊂ V

do onjunto omple-mentar

S = V \ S

¯

. O problemade orteno grafopode ser formuladode várias maneiras, dependendo da es olha da função objetivo a otimizar. Uma das mais populares funções

para otimizar(CHUNG,1996) é:

cut(S, ¯

S) =

X

v

i

∈S,v

j

∈ ¯

S

a

ij

.

(2.23)

(34)

ontendo os nós isolados. Para onseguir um melhor equilíbrio na ardinalidade de

S

e

¯

S

, sugere-se a otimização dafunção de orte normalizada(SHI; MALIK, 2000):

Ncut(S, ¯

S) = cut(S, ¯

S)

1 assoc(S, V )

+

1 assoc( ¯

S, V )

,

(2.24)

emquea asso iação

assoc(S, V )

étambém onhe ido omo ovolume de

S

:

assoc(S, V ) =

X

v

i

∈S,v

j

∈V

a

ij

≡ vol(S) =

X

v

i

∈S

d

ii

.

(2.25)

Há outrasdenições de funções para otimizar,porexemplo, a ontundên ia (KANNAN;

VEMPALA; VETTA, 2004),a asso iaçãonormalizada (SHI;MALIK, 2000) ea razãode

orte(DHILLON; GUAN; KULIS,2004).

A omplexidade em otimizar essas funções objetivo é muito elevada (por exemplo,

a otimização do orte normalizado é NP-Hard (SHI; MALIK, 2000; WAGNER; W

AG-NER, 1993)) e por esta razão, tem-se pro urado usar on eitos espe trais de análise de

grafos. Estes on eitos podem ser formulados a partir da introdução da matriz

Lapla i-ana (CHUNG,1996):

L

_{= D − A,}

(2.26)

que pode ser visto omo um operador linear em

G

. Além desta denição de matriz Lapla iana,existem outras denições alternativas:

•

Lapla ianaNormalizada, dada por

L

N

= D

−1/2

_LD

−1/2

;

•

Lapla ianaGeneralizada, dada por

L

G

= D

−1

_L

;

•

Lapla ianaRelaxada, dada por

L

ρ

= L − ρD

.

Cadadeniçãoéjusti adaporpropriedadesespe iaisdesejáveisemumdeterminado

on-texto. A de omposição espe tral da matriz Lapla iana pode forne er informações úteis

sobreaspropriedadesdografo. Emparti ular, pode ser vistoque osegundo menor

auto-valorde

L

está rela ionado om o orte nografo (FIEDLER,1973) eos orrespondentes autovetorespodemagruparobservaçõessemelhantes(CHUNG,1996;SHI;MALIK,2000;

BRAND;HUANG, 2003).

O problema da redução de dimensionalidade tem omo objetivo en ontrar uma

re-presentação dimensional adequada de um onjunto de dados em um espaço dimensional

elevado. Em Belkin e Niyogi (2003), ada nó no grafo, que representa uma observação,

(35)

espe tral da matriz Lapla ianadografo obtido permite en ontrar uma representação

di-mensionalbaixade

X

.

São inúmerososalgoritmosqueforamdesenvolvidos para resolveroproblema de

par-ti ionamentode dadospormeiode métodos espe trais. Dentre eles, podem ser itadosos

algoritmode Shi &Malik(SHI; MALIK,2000),Ng, Jordan&Weiss, Perona&Freeman,

dentre outros (WAGNER; WAGNER, 1993; FILIPPONE et al., 2008). Neste trabalho,

fo aremosnautilizaçãodoalgoritmoespe tral Ng,Jordan &Weiss, adaptadopara

agru-pardadosdeformas e omparando-o om aadaptaçãoparadadosdeformasdoalgoritmo

k

-médias, proposta porAmaral etal. (2010).

2.4.1 Algoritmo de Ng, Jordan & Weiss

O algoritmo de Ng, Jordan & Weiss utiliza autovetores da matriz Lapla iana, além

de, através doalgoritmo

k

-médias,obter uma partiçãodo onjuntode observações (MO-RAIS, 2012). É des rito abaixo, o roteiro do algoritmo para um onjunto de dados

(36)

Algoritmo 2:Algoritmo Ng, Jordan & Weiss

Entrada: Conjuntode observações

X

= {x

1 , . . . , x

n

}

enúmero de grupos

k

; Saída: Grupos

C

r

(1 ≤ r ≤ k)

;

1 Cal ulematriz de adja ên ia

A = [a

ij

] ∈ R

n×n

,

a

ij

=











exp

−

d

2 _(x

i

, x

j

)

2σ

2 ,

se

i 6= j;

0,

aso ontrário

,

onde

d

2 _(x

i

, x

j

)

representa a distân iaeu lidiana quadradaentre duas observações

i

e

j

. Como um ritériopara aes olha de

σ

2

diversos autores sugerem uma bus a

em um grid;

2 Cal ulea matriz Lapla iananormalizada

L

= D

−1/2

_AD

−1/2

;

3 En ontre os

k

autovetores de

L

asso iados aos seus

k

maioresautovalores;

4 Construa uma matriz

Z

on atenando os

k

autovetores asso iados aos

k

maiores autovalores de

L

;

5 Obtenha a matriz

Y

através de

Z

, apli ando

y

ij

= z

ij

/

P

k

r=1

z

ir

2

, fazendo om que todas as linhasde

Z

tenhamnorma unitária. Este pro edimento mapeia os pontosoriginais para uma esfera unitária;

6 Usando

Y

,obter os grupos utilizandooalgoritmo

k

-médias lássi o;

7 Atribuiro ponto original

x

i

aogrupo

j

se e sóse alinha

i

damatriz

Y

perten er aogrupo

j

.

Podendo ser vista omo um grafo,a matriz de anidade ligaentre si assuas linhas e

as olunas, representando as ligações entre os vérti es de um grafo, em que o valor dos

ampos damatriz representa os própriosvérti es.

2.4.2 Agrupamento espe tral para dados de formas

No ontexto de análise de dados de formas, um kernel de Mer er ou kernel

positivo-denido é obtido quando substituímos a distân ia eu lidiana no kernel gaussiano pela

distân iade pro rustes ompleta,resultandonoentão hamadokernelgaussiano

pro rus-tes (JAYASUMANA etal.,2013).

A função kernel gaussiana pro rustesé

h(z

i

, z

j

) = exp

−

d

2 F

(z

i

, z

j

)

2σ

2 = exp

−

1 − |(z

∗

i

z

j

)|

2 2σ

2

(2.27)

(37)

positivodenido para todo

σ

2 _{∈ R}

+

.

Apropostadonossotrabalho onsistenaadaptaçãodo ál ulodamatrizdeadja ên ia

no algoritmo de Ng, Jordan & Weiss om base na função kernel, usando a distân ia de

Pro rustes Completa. Além disso, o algoritmode agrupamento espe tral de Ng, Jordan

&Weiss, usualmente utilizado emdados lássi os,foi utilizadopara análise de dados de

(38)

APLICAÇÕES

3.1 Introdução

Neste apítuloserãoapresentadasades riçãodediversos onjuntosdedadosdeformas

extraídosdos pa otesshapes,geomorph emomo s, dosoftware estatísti o R, juntoa uma

omparação do método proposto (Ng, Jordan & Weiss para dados de formas planas)

om o algoritmo

k

-médias para formas proposto por Amaral et al. (2010). A Tabela 3.1 apresenta os onjuntosde dados utilizados no estudo, suas dimensões e o número de

grupos, apriori, de ada onjuntode dados.

Tabela 3.1: Conjunto de dados utilizados no estudo, formato dos dados e número de

grupos de ada onjunto.

Dados Formato Númerode grupos

Cérebros de esquizofrêni os e não-esquizofrêni os 8

×

2

×

30 2

Vértebra de amundongos 6

×

2

×

76 3

Crânios de gorilas 8

×

2

×

59 3

Crânios de ma a os 7

×

3

×

18 2

Crânios de grandes primatas 8

×

2

×

167 3

Cérebros de adultos saudáveis 24

×

3

×

58 2

Crânios de himpanzés 8

×

2

×

54 2

Crânios de orangotangos 8

×

2

×

60 2

Grãos de areia 50

×

2

×

49 2

Cabeças de salamandras 12

×

2

×

40 2

Asas de mosquito 18

×

2

×

40 2

Caudas de salamandras larvais 17

×

2

×

64 6

Glumas de ereais 21

×

2

×

172 3

(39)

Foirealizadauma bus a emgrid para seen ontrar o valorótimo doparâmetro

σ

2

do

kernel Gaussiano, em ada apli ação, e os melhores valores para esses parâmetros estão

apresentados na Tabela3.2. A denição dogrid para abus a foi feitade formaempíri a

para ada onjunto de dados. Por exemplo, para o onjunto de dados de érebros de

esquizofrêni os ede nao-esquizofrêni os, variamosovalorde

σ

2

entre

0.001

e

1

por

0.001

para os dois métodos, enquanto que para os dados de rânios de himpanzés, o melhor

valor de

sigam

2

foi en ontrado no intervalo entre

0.1

e

1

por

0.1

para o algoritmo Ng, Jordan & Weiss om a distân ia de pro rustes ompleta e entre

1

e

10

por

0.1

para o algoritmoNg,Jordan & Weiss no espaço tangentedas formas.

Tabela3.2: Parâmetros

σ

2

do kernel Gaussiano apli adosà ada onjuntos de dados por

meio doalgoritmoNg,Jordan & Weiss.

Dados Parâmetros da Função kernel

Ng, Jordan &Weiss Ng,Jordan & Weiss

Pro rustes Completo Eu lid. esp. tang.

Cérebros de esquiz. e não-esquiz. 0.001 0.001

Vértebra de amundongos 0.0001 5

Crâniosde gorilas 0.1 0.1

Crâniosde ma a os 0.001 0.001

Crâniosde grandes primatas 0.25 0.25

Cérebros de adultos saudáveis 0.25 0.25

Crâniosde himpanzés 0.5 10

Crâniosde orangotangos 0.5 10

Grãos de areia 1 1

Cabeças de salamandras 0.01 0.1

Asas de mosquito 0.1 1

Caudas de salamandras larvais 0.0001 0.0001

Glumas de ereais 1 0.001

Corações desenhados a mão 0.0001 0.0001

3.1.1 Índi es de avaliação

Para omparar os métodos de agrupamento onsiderados nestetrabalho, utilizamoso

Índi e de Rand Ajustado (IRA) (HUBERT; ARABIE, 1985) e a taxa total de erro de

alo ação(TEA) (BREIMAN et al.,1984).

Seja

P = {P

1 , . . . , P

i

, . . . , P

c

}

apartiçãoapriori de

Ω = {1, . . . , n}

em

c

lasseseseja

P = {P

1 , . . . , P

k

, . . . , P

K

}

uma partiçãorígida de

Ω = {1, . . . , n}

em

K

gruposforne idos por um algoritmo de agrupamento. As quantidades

n

ik

,

i = 1, . . . , c

,

k = 1, . . . , K

, representam o número de observações que estão na lasse

P

i

e no grupo

P

k

e podem ser representadas na formadaTabela3.3, denominada matrizde onfusão.

(40)

Tabela3.3: Matriz de onfusão. Grupos Classes

P

1 · · ·

P

k

· · ·

P

K

P

1 n

11 · · ·

n

1k

· · ·

n

1K

n

1•

=

P

K

k=1

n

1k

. . . . . .

· · ·

. . .

· · ·

. . . . . .

P

i

n

i1

· · ·

n

ik

· · ·

n

iK

n

i•

=

P

K

_k=1

n

ik

. . . . . .

· · ·

. . .

· · ·

. . . . . .

P

c

n

c1

· · ·

n

ck

· · ·

n

cK

n

c•

=

P

K

_k=1

n

ck

P

n

•1

=

P

c

i=1

n

i1

· · ·

n

•1

=

P

c

i=1

n

i1

· · ·

n

•1

=

P

c

i=1

n

i1

n =

P

c

i=1

P

K

k=1

n

ik

OÍndi e de Rand Ajustado (IRA) é obtido omo

CR =

P

c

i=1

P

K

k=1

n

ik

2 −

n

2 −1

P

c

i=1

n

i•

2 P

K

k=1

n

•k

2

1

2 h

P

c

i=1

n

i•

2 + P

K

k=1

n

•k

2 i

−

n

2 −1

P

c

i=1

n

i•

2 P

K

k=1

n

•k

2 ,

(3.1) onde

n

2 =

n(n−1)

2

,

n

ik

representa o número de observações que estão na lasse

P

i

e no grupo

P

k

,

n

i•

representa o número de observações na lasse

P

i

,

n

•k

representa o número de observações nogrupo

P

k

, e

n

é onúmerototal de observaçõesno onjunto de dados.

OIRA avaliaograude on ordân ia(similaridade)entreumapartiçãoapriori euma

partiçãoforne idaporum métodode agrupamento. Alémdisso, o IRA não é sensível ao

númerode lassesnaspartiçõesouàdistribuiçãodasobservaçõesnosgrupos. Finalmente,

oIRA assumevalores nointervalo

[−1, 1]

, no qualo valor1 indi a on ordân iaperfeita entre as partições, enquanto que valores próximos de zero ou negativos orrespondem a

on ordân iaentre partiçõesen ontrada ao a asoMilligan(1996).

Em problemas de lassi ação, ada grupo

P

k

é asso iado a uma lasse a priori

P

i

e estaasso iação deveser interpretada omo seaverdadeira lassea priori fosse

P

i

. Dessa forma,para uma observação perten ente aum dadogrupo

P

k

ade isão está orretase a lasseaprioridessaobservaçãoé

P

i

. Paraobterumataxadeerrode lassi açãomínima, pre isamos en ontrar uma regra de de isão que minimizeaprobabilidade de erro.

Seja

ℓ(P

i

, P

k

)

aprobabilidadea posteriori dequeumaobservação pertençaà lasse

P

i

quando asso iadoao grupo

P

k

. Seja

ℓ(P

k

)

a probabilidadede que a observação pertença aogrupo

P

k

. A função

ℓ

é onhe ida omo função de verossimilhança.

(41)

posteriori

ℓ(P

i

, P

k

)

e oíndi e da lasse a priori asso iadaa esta modaédada por

MAP (P

k

) = arg max

1≤i≤c

ℓ(P

i

, P

k

).

A regra de de isão de Bayes que minimiza a probabilidade média de erro é sele ionar a

lassea priori que maximizaaprobabilidadea posteriori. Ataxa de erro de alo açãodo

grupo

P

k

éigual a

1 − ℓ(P

M AP (P

k

)

/P

k

)

ea taxatotalde erro de alo ação(TEA) é iguala

T EA =

K

X

k=1

ℓ(P

k

)(1 − ℓ(P

M AP (P

k

)

/P

k

)).

Para uma amostra,

ℓ(P

M AP (P

k

)

/P

k

) = max

1≤i≤c

n

ik

/n

•k

.

A taxa total de erro de alo ação (TEA) foi on ebida de modo amedir a habilidade

de um algoritmode agrupamentoen ontrar as lasses apriori presentes emum onjunto

de dados eé al ulada da forma:

T EA =

K

X

k=1

n

•k

n

1 − max

_1≤i≤c

n

ik

/n

•k

= 1 −

P

K

k=1

max

1≤i≤c

n

ik

n

.

(3.2)

Oíndi eTEAassumevaloresnointervalo

[0, 1]

,noqualvalorespróximosdezeroindi am maiorhabilidade de um algoritmonadete ção de lasses a priori.

3.2 Apli ações

Esta seção ompreende na omparação dos algoritmos

k

-médias (4) e Ng, Jordan & Weiss (7) apli ados a onjuntos de dados de formas. Os resultados para 14 onjunto

de dados foram apresentados em tabelas, onsiderando os índi es de avaliação IRA e

TEA, denidos outrora,para as distân ias de Pro rustes, Pro rustes Par ial, Pro rustes

Completa edistân iaeu lidiana no espaçotangente.

Na Tabela3.4, dispomos um resumoa er a dodesempenho dos métodos omparados

onsiderandoaspossíveisdistân iasqueosalgoritmospermitemutilizar. A partirdos

re-sultadosdosdoisíndi esdeavaliação,desta amos, omo ír uloha hurado(

•

),ométodo queapresentouvaloressuperioresemrelaçãoaosdemais. Osmétodos(edistân ias)

onsi-deradossão

k

-médiasdepro rustes ompleto(

k

F P

),

k

-médiasdepro rustespar ial(

k

P P

),