Centro de Ciên ias Exatas e da Natureza
Departamento de Estatísti a
Agrupamento Espe tral para Dados de Formas
Diogo Vas on elos Cândido
Agrupamento Espe tral para Dados de Formas
Monograa apresentada ao Curso de
Ba- harelado em Estatísti ada Universidade
FederaldaParaíba omo requisitopar ial
paraobtenção doGrau deBa harel. Área
de Con entração: Estatísti aApli ada.
João Pessoa
que, ertamente, em muito me agregaram ao longo
AgradeçoaoSenhorDeus, pelodom davidaepormepermitirdar maisum passo,ao
on luiresta graduação. Sem Ele,nada poderiater sido feito.
Aos meus pais, Ginaldo e Sandra, obrigadopor serem meus maiores in entivadores e
patro inadores. Queridos pais, essa onquista évossa. Minha eterna gratidãopor todoo
esforço empenhando emmeu favor.
À vo ê, minhasegunda professora de todas as dis iplinas,um obrigado do tamanho
do meu amor por ti. Foram 8 períodos de ontínuo suporte. Das mais simples até as
mais omplexas dis iplinas, dos numerosos trabalhos em equipe e das innitas listas de
exer í ios. Certamente eu ainda estaria no meio do aminho se vo ê não estivesse nele.
Obrigado, Adeni e.
Meus amigos de turma, André e Anny, vo ês são pra vida toda. Minha gratidão se
estende a vo ês, que emmuito meagregaram aolongo desses anos. Obrigado por todoo
bom humor e enorme par eria. Zé e Lukas, vo ês são irmãos. Me sinto privilegiado por
poder onviver om pessoas tão espe iais.
Professor Mar elo, vo ê é fantásti o. Minha admiração por ti enquanto pessoa e
prossionalégrande. Foiumpresenteter meuTCCorientadoporvo ê, eagora olhemos
ofrutode um trabalhotão ex elente que exe utamos em onjunto. Obrigado porser tão
pa ientee fazerjus ao título de orientador.
Minhagratidãotambémnãopoderiadedeixardeexistirpara omosaten iosos
profes-soresdoDE, em espe ial aos quetiveoprivilégiode ursaralgumadis iplina. Professora
AnaFlávia,é até difí ilexpressar empou as palavraso sentimento que temosa respeito
dasenhora. A palavra obrigado,apesar de simples,traz um enormepeso de alegria em
poder ter ompartilhadovários momentos des ontraídos ao seu lado. Professor Hemílio,
vo ê foium paizão. Minhagratidãotambémse apli aaosenhor, quemedeu a
oportuni-dadede ser seu aluno projetistaPIBIC. Apesar de todaa di uldade,as liçõesextraídas
aolongo de dois anos de trabalhovaleram todoo esforço.
Aosamigosefamiliares,sintam-sein luídosnestaseçãode agrade imentos. Vo êssão
responsáveisporpartilharde momentosalegres e tristes, sempre om muito apoio. Deus
te abençoe Adelma, Alysson, Andreia, Arielly, Bárbara, Brenda, Carol, Chi o, Clarissa,
Cris, Douglas, Edgard, Ellen, Flávia, Flor, Gê, Gilvandro, Jéssi a, Jhon, João, Joy e,
mas transformai-vos pela renovação da mente,
a m de distinguir qual é a vontadede Deus:
o queé bom,o que Lhe é agradável, o queé perfeito.
A oletade informaçõesgeométri as,apartirdoavanço date nologia, eoestudodas
for-mas de objetostem se tornado ada vez mais omum eimportante. A análise estatísti a
de formas (AEF) utiliza métodos estatísti os para a análise de estruturas geométri as e
suasapli açõespodemseren ontradasemdiferentesáreasda iên ia. Noentanto,umdos
problemasde interessenaAEFéestender osmétodos lássi osde análiseestatísti a para
dadosde formas de objetos, oupropor novos métodos para esse tipode dado. Na AEFé
omum existir ane essidade de agrupamento emum onjuntode dados de modoa obter
grupos om ara terísti asmais homogêneas. Osmétodos de agrupamentosão
ferramen-tasúteis para explorar estruturas em onjuntos de dados sendo utilizados, por exemplo,
empara re onhe imentonão-supervisionadodepadrões. Ométodo
k
-médiasguraentre osmétodos de agrupamento mais antigos e mais omumente utilizadosna práti a. Mas,apesar de sua simpli idadee e iên ia, oalgoritmo
k
-médiasapresentaalgumas de iên- ias. Por ausadisso,háane essidadedaproposiçãodemétodosalternativosquepossamapresentarbonsresultados emsituaçõesondeoalgoritmo
k
-médiasfalha. Osmétodosde agrupamento espe tral surgem a partir de on eitos da teoria espe tral dos grafos ondeo problema de agrupamentoé ongurado omo um problema de orte nografo em que
uma função objetivo apropriada deve ser otimizada. Neste trabalho apresentamos uma
adaptaçãodo algoritmode agrupamento espe tral de Ng,Jordan & Weiss para dadosde
formasplanas de objetos eo omparamos auma adapataçãodoalgoritmo
k
-médiaspara dados de formas planas. Foram realizadas apli ações om 14 onjuntos de dados reaise veri ou-se que o algoritmo espe tral adaptado de Ng, Jordan & Weiss, onsiderando
asdistân ias de pro rustes ompleta e eu lidiananoespaço tangenteobteve desempenho
superior aométodode agrupamento
k
-médias, forne endo evidên iasde que aadaptação proposta é e iente para dados dessa natureza.Palavras- have: Agrupamento espe tral; Formas; Algoritmo de Ng, Jordan & Weiss;
Withthe advan e of te nology, the olle tionof geometri al informationfromimages
be ame usual. Statisti alshape analysis uses statisti al methodsto analyse geometri al
stru tures and an be applied in several areas. One parti ular problem of interest in
statisti alshape analysis is the adaptationof lassi al statisti almethods forshape data
orthepropositionofnewmethods. Instatisti alshapeanalysisitis ommonthe needfor
lustering shape data toobtain lusters with similar hara teristi s. Clustering methods
areusefultoolstoexplorestru turesindataandhavebeenused forunsupervisedpattern
re ognition. The
k
-means algorithmisamong theoldest and mostwidely used lustering methods. Despiteitssimpli ityande ien y,thek
-meansalgorithmhassome problems. Be ause of this, it is important to propose alternate methods that an be useful wherethe
k
-means fails. Spe tral lustering methods arise from spe tral theory of graphs and the lustering problem an be formulated as a graph ut where anappropriate obje tivefun tion should be optimized. In this work we propose an adaptation of the Ng, Jordan
&Weiss spe tral lusteringalgorithmfor plannarshapedata. Weperformedappli ations
on 14 plannar shape data sets and veried that the adapted version of the Ng, Jordan
&Weiss algorithm onsidering the full pro rustesdistan e and the eu lidean distan e on
the shapes tangent spa e outperforms the version of the
k
-means algorithm for plannar shapes, orroboratingthat the proposed adaptation is e ient for shape data.Lista de Figuras viii Lista de Tabelas ix 1 Introdução 1 1.1 Denição e Motivação . . . 1 1.2 Organização doTrabalho . . . 6 2 Referen ial Teóri o 7 2.1 Análise Estatísti ade Formas (AEF) . . . 7
2.1.1 Representação Matemáti a de Formas. . . 7
2.1.2 Distân ia Pro rustes para aso planar. . . 11
2.1.3 Coordenadas no Espaço Tangente . . . 14
2.2 Algoritmo
k
-médias para formas . . . 152.3 Funçõeskernel. . . 16
2.4 AgrupamentoEspe tral. . . 18
2.4.1 Algoritmo de Ng, Jordan &Weiss . . . 20
2.4.2 Agrupamento espe tralpara dados de formas . . . 21
3 Apli ações 23 3.1 Introdução . . . 23
3.1.1 Índi es de avaliação . . . 24
3.2 Apli ações . . . 26
3.2.1 Cérebros de esquizofrêni os e não-esquizofrêni os . . . 27
3.2.2 Vértebras de amundongos . . . 28
3.2.3 Crânios de gorilas . . . 29
3.2.4 Crânios de ma a os . . . 30
3.2.7 Crânios de himpanzés . . . 31
3.2.8 Crânios de orangotangos . . . 32
3.2.9 Grãos de areia. . . 32
3.2.10 Cabeças de salamandras . . . 33
3.2.11 Asas de mosquito . . . 34
3.2.12 Caudas de salamandras larvais. . . 34
3.2.13 Glumas de ereais . . . 35
3.2.14 Coraçõesdesenhados a mão . . . 35
4 Considerações Finais 36 4.1 Con lusões. . . 36
4.2 Trabalhos futuros . . . 37
Referên ias bibliográ as 38
1.1 Vértebra T2 de rato om 6 mar os matemáti os (junções de linhas) e 42
pseudo-mar os. . . 4
2.1 Congurações de um gorila ma ho. . . 10
2.2 A forma médiaPro rustes ompleta de gorilas ma hos e fêmeas. . . 12
1.1 Áreas do onhe imento ealgumas apli açõesda análiseformas. . . 2
3.1 Conjunto de dados utilizados no estudo, formato dos dados e número de
gruposde ada onjunto. . . 23
3.2 Parâmetros
σ
2
do kernel Gaussiano apli ados à ada onjuntos de dados
por meio doalgoritmoNg, Jordan &Weiss. . . 24
3.3 Matriz de onfusão. . . 25
3.4 Resumodosresultadosdasapli açõesapartirdosíndi esdeavaliaçãopara
ada distân ia onsiderada aos métodos utilizadosneste trabalho. . . 27
3.5 Taxa de Erro de Alo ação (TEA) e Índi e de Rand Ajustado (IRA)
ob-tidos pelos métodos de agrupamento onsiderados apli ados aos dados de
esquizofrêni os e não-esquizofrêni os. . . 28
3.6 Taxa de Erro de Alo ação (TEA) e Índi e de Rand Ajustado (IRA)
ob-tidos pelos métodos de agrupamento onsiderados apli ados aos dados de
vértebras T2 de amundongos. . . 29
3.7 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodosdeagrupamento onsideradosapli adosaosdadosde rânios
de gorilas. . . 29
3.8 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodosdeagrupamento onsideradosapli adosaosdadosde rânios
de ma a os. . . 30
3.9 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodosdeagrupamento onsideradosapli adosaosdadosde rânios
de grandes primatas. . . 31
3.10 Taxa de Erro de Alo ação (TEA) e Índi e de Rand Ajustado (IRA)
ob-tidos pelos métodos de agrupamento onsiderados apli ados aos dados de
pelos métodosdeagrupamento onsideradosapli adosaosdadosde rânios
de himpanzés. . . 32
3.12 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodosdeagrupamento onsideradosapli adosaosdadosde rânios
de orangotangos. . . 32
3.13 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodos de agrupamento onsiderados apli adosaos dados de grãos
de areia. . . 33
3.14 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelosmétodosdeagrupamento onsideradosapli adosaosdadosde abeças
de salamandras. . . 33
3.15 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodos de agrupamento onsiderados apli ados aos dados de asas
de mosquito.. . . 34
3.16 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodos deagrupamento onsideradosapli adosaosdadosde audas
de salamandraslarvais. . . 34
3.17 TaxadeErrode Alo ação(TEA)eÍndi ede RandAjustado(IRA)obtidos
pelos métodosdeagrupamento onsideradosapli adosaosdadosdeglumas
de ereais. . . 35
3.18 Taxa de Erro de Alo ação (TEA) e Índi e de Rand Ajustado (IRA)
ob-tidos pelos métodos de agrupamento onsiderados apli ados aos dados de
INTRODUÇO
1.1 Denição e Motivação
Objetos, sejamelesnaturaisouarti iais,podemseren ontradosportodaparte. Com
o avanço da te nologia, a oleta de informações geométri as tem se tornado rotina e o
estudoda formade objetostem se tornado ada vez mais importante(DRYDEN;
MAR-DIA,1998). Aanálise estatísti a de formas (AEF) éuma área de pesquisa relativamente
nova, que apli a métodos estatísti os para a análise de estruturas geométri as. Em um
sentido amplo, aformulaçãomatemáti a da AEFé semelhanteà análise estatísti a
mul-tivariada. Apli açõesdaAEF podem ser en ontradas emdiferentes áreas da iên ia. Em
visão omputa ional, asformasdas fronteiras emimagenstêm umimportantepapel. Em
medi ina, a análise daforma de dados anatmi os pode ajudar no diagnósti o de
diver-sasdoenças. As formas de ara tereses ritos podem ser usadas omo meios primáriosde
identi ação. Embiometriahumana,aidenti açãodepessoasatravésdesuasdigitaisou
es aneamento fa ialsão exemplos de análise de formas. A Tabela1.1 apresenta algumas
apli açõesonde a análisede formas pode ser impres indível(COSTA; JR, 2000).
O trabalho seminal The diusion of shape em análise de formas foi publi ado em
1977, por David Kendall, e apresenta um breve resumo no qual é introduzida uma nova
representação deformas deobjetosemespaços omplexosprojetados (KENDALL,1977).
Alguns anos depois,Kendall (1984) deniu forma omo toda informaçãogeométri a que
resta quando os efeitos de tamanho, rotação e es ala são retiradas de um objeto.
Ken-dalltambém props um sistema de oordenadas om nalidade de obter a forma de um
objeto através de pontos dispostos em seu ontorno hamados de mar osanatmi os. A
Tabela1.1: Áreas do onhe imentoe algumasapli açõesdaanálise formas.
Área do Conhe imento Exemplo de Apli ações
Neuro iên ia Taxonomia morfológi a de neurnios,
in-vestigaçõessobrearelaçãofunçãoeforma
das élulas, omparação entre élulas de
diferentes áreas orti ais e de diferentes
espé ies, modelagem de élulas
biologi a-mente realistas.
Análise de Do umentos Análisededo umentoseletrni os
(textu-aisouvisuais) omo emapli açõesCBIR,
sistemas OCR (Opti al Chara ter
Re og-nitions), análise de dados em ban o de
dadosmultimídia.
Artes Visuais Restauração de vídeo, efeitos espe iais,
monitoramentode vídeo, jogos,
omputa-ção grá a,síntese de imagens.
Medi ina Identi ação de tumor, quanti ação de
mudança e deformação de estruturas
anatmi as, análise numéri a de
romos-somos, identi açãode doençasgenéti as.
Biologia Identi açãode espé ies,taxonomia,
rela-ção entre forma efunção, omparativo de
anatomias, itologia, identi ação e
on-tagem de élulas ( omo glóbulos bran os
nosangue), ara terizaçãode élulase
for-mas nu leares, res imento e modi ação
de formas de estruturas, análise daforma
de aminhar dos seres vivos.
Físi a Apli ações envolvendo mi ros opia omo
a análise da trajetória, omportamento e
distribuiçãode partí ulas em um meio ou
material,análisede estruturas omo
polí-meros e ristais, ara terização de grupos
de estrelas ou análise de propriedades de
orpos elestes emastronomia, análise do
movimento de objetos ma ros ópi os
(ve-lo idade,a eleração, et .).
Engenharia Controle visual de qualidade de produtos
emlinha de produção,dete ção de perigo,
interpretação (pelas máquinas) de
dese-nhos feitos à mão, automação, robóti a,
sensoriamentoremoto.
Segurança Dete ção de impressão digital, fa e e íris,
veri ação de assinaturaemodode andar
de uma pessoa (biometria).
Agri ultura Controle de olheita, ontagem de
eBookstein (1986).
Apesardeanálisedeformaspoderserinvestigadaatravésdemétodosmatemáti os
tra-di ionais(ROHLF; BOOKSTEIN, 1990), háum interesse emrealizar omparação direta
daforma dos organismos (MARE; CORSEUIL, 2004). A utilização de mar os
anatmi- osé umdesses métodosde omparaçãodireta,usado pararepresentarasformas de uma
maneira ompreensivapormeiode dadosnuméri osmédios. Osdadospodemser obtidos
através de oordenadas médias de mar os distribuídosperiferi amente, oudentrodas
es-truturasanalisadas, oudas distân ias entre os mar osanatmi oses olhidos diretamente
para adaespé ie.
Ummar oéum pontode orrespondên iaem ada objetoque oin ideentre edentro
das populações ou grupos, ou seja, todos os objetos possuem os mesmos mar os. Um
mar oanatmi o,porsuavez,éumpontoatribuídoporum espe ialista,que orresponde
entre organismos, de algumaforma biologi amentesigni ativa,por exemplo,o antode
um olho oua reuniãode duas suturasemum rânio. Já mar osmatemáti os são pontos
lo alizadosnum objeto de a ordo omalgumapropriedade matemáti aougeométri ada
imagem, por exemplo, pontos de alta urvatura ou pontos extremos. Por m,
pseudo-mar os são pontos onstruídos emum objeto, lo alizados aoredor do ontorno ou entre
mar osanatmi osoumatemáti os. Nagura1.1vemos6mar osmatemáti osempontos
de alta urvatura e 42 pseudo-mar os mar ados no ontorno de uma segunda vértebra
torá i a (T2) de rato. Os mar os ainda podem ser denidos em três tipos adi ionais,
onde osmar os do tipoI o orrem najunção de te idos/ossos; os dotipo II são denidos
por propriedades lo ais, tais omo urvaturas máximas e os mar os do tipo III o orrem
Figura 1.1: Vértebra T2 de rato om 6 mar os matemáti os (junções de linhas) e 42
pseudo-mar os.
Fonte: DrydeneMardia(1998).
Um dos problemas de interesse em AEF é estender métodos lássi os de análise
es-tatísti a para dados de formas de objetos ou propr novos métodos para este tipo de
dado.
É omumexistir,emanálisedeformas,ane essidadedeagrupamentoemum onjunto
de dados, de tal forma que se obtenha grupos om ara terísti as mais homogêneas.
Por exemplo, quando se deseja dete tar o número de diferentes espé ies, a análise de
agrupamento pode ser um ex elente re urso para dete ção dos grupos(AMARAL etal.,
2010). Dessa forma, diversos pesquisadores têm onduzido estudos e têm estudado a
performan e desses métodos.
Osmétodosdeagrupamentosãoferramentasúteisparaexplorarestruturasem
onjun-tosde dados sendo utilizados, por exemplo,em para re onhe imentonão-supervisionado
de padrões. A tarefa de agrupar signi a organizar um onjunto de observações
(indi-víduos, objetos, et .) em grupos de tal forma que observações perten entes a um dado
grupo têm um alto grau de similaridade, enquanto que observações perten entes a
gru-pos diferentes têm um alto grau de dissimilaridade (GORDON, 1999; JAIN; MURTY;
emdiversasáreasda iên ia,tais omo,taxonomia,pro essamentode imagens,mineração
de dados, re uperação de informação,dentre outras.
As té ni as de agrupamento mais populares podem ser divididas em métodos
hierár-qui osemétodosparti ionais. Osmétodoshierárqui osproduzemumaresposta
represen-tadaporumaestrutura ompletadehierarquia,i.e.,umasequên iaaninhadadepartições
do onjuntode observações de entrada; sua saída é uma estrutura hierárqui ade grupos
onhe ida omodendrograma. Poroutrolado,nosmétodosparti ionaisoobjetivoéobter
umapartiçãoúni ado onjuntodeobservaçõesemumnúmeroxodegrupos,tipi amente
através daotimização (geralmente lo al) de uma funçãoobjetivo;o resultado é a riação
de hipersuperfí ies de separação entre os grupos.
Os métodos de agrupamento parti ionais foramdesenvolvidos sob dois diferentes
pa-radigmas: agrupamento rígido (hard) e agrupamento difuso (fuzzy). Nos métodos de
agrupamento do tipo rígido, os grupos são naturalmente disjuntos e não se sobrepõem.
Nesse aso, adapadrãopodeperten eraum,esomenteum,grupo. No asodosmétodos
deagrupamentodotipodifuso,umpadrãopodeperten eratodososgrupos omum erto
grau de pertinên ia. Uma exposição detalhada dos prin ipais métodos de agrupamento
difuso pode ser en ontrada em Höppner (1999). Em adição, uma boa revisão sobre os
vários métodos de agrupamento pode ser en ontrada, por exemplo, em Jain (2010) ou
em Jain, Murty e Flynn (1999).
Ométodo
k
-médias(HARTIGAN;WONG,1979) gura entre osmétodos de agrupa-mento mais antigos e mais utilizados em problemas práti os (JAIN, 2010). Tal métodoonsistenadivisão de um onjuntode observaçõessobreum espaçométri oem
k
grupos, de maneira que a soma dos quadrados das distân ias entre ada observação e a médiado grupo ao qual ela perten e seja a mínima possível. Esta divisão é, em geral, obtida
por meio de algoritmos iterativos. Amaral et al. (2010) propuseram uma adaptação do
método
k
-médias lássi opara dadosde formas planas (bidimensionais)de objetos. Eles onsideraram três tipos de distân ias apropriadas para dados de formas, além de umaversão dométodobaseado nadistân iaEu lidiana lássi a obtidanoespaçotangentedas
formas. Apesar de sua simpli idade ee iên ia, o algoritmo
k
-médias apresentaalgumas de iên ias. Por essa razão, surge a ne essidade da proposição de métodos alternativos,quepossam apresentar bons resultados em situações ondeo algoritmo
k
-médiasfalha. Osmétodosdeagrupamentoespe tralsurgemde on eitosdateoriaespe traldosgra-foseoagrupamentoé ongurado omoumproblemade podanografo,ondeumafunção
objetivo apropriada deve ser otimizada. A ideia bási a é onstruir um grafo ponderado
a partir do onjunto de dados ini ial, onde ada nó representa uma observação e ada
observa-ções. A ideia prin ipal desta teoria é a de omposição espe tral da matriz lapla ianado
grafoponderado obtido apartir dos dados originais(FILIPPONE et al.,2008). Verma e
Meila(2003),Kannan, VempalaeVetta (2004),Shawe-Taylor eKandola(2001)
apresen-tam omparações entre diversos métodos de agrupamento espe tral e métodos lássi os
deagrupamento,enquantoLuxburg(2007)apresentaum tutorialsobremétodosde
agru-pamentoespe tral.
Neste trabalho apresentaremos uma adaptação do algoritmo de agrupamento
espe -tralde Ng, Jordan e Weiss (NG; JORDAN; WEISS, 2001) para dados de formas planas
de objetos. Partiremos da denição de funções kernel adequadas para dados de
for-mas(JAYASUMANA etal.,2013), introduzindoum algoritmode agrupamentoespe tral
adequadoparadados de formase umalgoritmode agrupamentoespe tral noespaço
tan-gente das formas. Apli ações om onjuntos de dados reais irão ilustras a utilidade dos
métodos propostos.
1.2 Organização do Trabalho
Alémdo apítulode introdução,estetrabalhoé ompostopormais três apítulos. No
Capítulo2 apresentamos uma revisão geral sobre Análise Estatísti a de Formas, emque
introduzindo uma representação matemáti a de formas seguido de subseções ontendo
informações a er a da distân ia de pro rustes para aso planar, oordenadas no espaço
tangente, além de apresentarmos oalgoritmo
k
-médiapara dados de formas e uma seção expli andoasfunçõeskernel. Aindaneste apítulo,éfeitaumarevisãosobreagrupamentoespe tral e o algoritmoespe tral de Ng, Jordan & Weiss. Finalizaremoso apítulo om
umaseção ontendonossapropostadetrabalho. NoCapítulo3,índi esdeavaliaçãoserão
utilizadosem onjuntosdedadosreais,objetivando-semensurarae á iadosalgoritmos.
Finalmente, no Capítulo4, são apresentadas as onsiderações nais a er ado trabalhoe
REFERENCIAL TEÓRICO
2.1 Análise Estatísti a de Formas (AEF)
Nesta seção, apresentaremos uma revisão geral sobre AEF, introduzindo uma
repre-sentaçãomatemáti adessetipodeanálise,emque on eitosbási ospara ompreensãoda
teoriaabordadaserãodenidos;seguidodas expli açõesparaoentendimentodadistân ia
de pro rustespara o aso planar e estudode oordenadas noespaço tangente.
2.1.1 Representação Matemáti a de Formas
Aespe i açãodeum sistemade oordenadaséessen ialparades riçãosobreaforma
de um objeto. São vários os sistemas de oordenadas: oordenadas de Bookstein,
pro-postas por Bookstein (1984, 1986); oordenadas polares de Kent, proposta por Kent
(1994); oordenadas de forma Goodall-Mardia QR desenvolvida por Goodall e Mardia
(1992, 1993); e entre outras, as oordenadas de Kendall podem ser vistas em Dryden e
Mardia(1998). Umaes olhaapropriada dosistemade oordenadas para formas deveser
invariantesob lo ação,es ala e rotaçãoda onguração.
Uma onguração é um onjunto de mar os em um objeto parti ular. Uma
ongu-ração matemáti a
X
é representada por uma matrizk × m
de oordenadas artesianas dek
mar osemm
dimensões. Oespaçoda onguraçãoéoespaçode todas oordenadaspossíveis dos mar os.
X
=
x
1,1
· · · x
1,m
x
2,1
· · · x
2,m
. . . . . . . . .x
k,1
· · · x
k,m
(2.1)Serão onsiderados os asos onde
k ≥ 3
em = 2
, oque orresponde asformas planas. Assima matrizde onguraçãoX
daexpressão (2.1) resume-se aX
= [x
1
x
2
]
⊤
=
x
1,1
x
1,2
x
2,1
x
2,2
. . . . . .x
k,1
x
k,2
(2.2)Algumas transformações devem ser feitas na matriz
X
para remover os efeitos de lo ação,es alaerotação. Param =
2,a onguraçãomatemáti adeveserrees rita omo um vetor omplexo. Dena um vetor omplexo (k × 1
) talquez
0
= (z
0
1
, . . . , z
k
0
)
⊤
= (x
1,1
+ ix
1,2
, . . . , x
k,1
+ ix
k,2
)
⊤
(2.3)oqual orresponde as oordenadas omplexas para osmar os.
Neste trabalho serão onsideradas as oordenadas de Kendall. O primeiro
traba-lho feito nesta área foi Kendall (1977), mas somente em Kendall (1984) que realmente
formalizou-seedeniu-seos on eitosbási os. Umdospontosmaisrelevantesdotrabalho
deKendallfoiapropostadosistemade oordenadas. Estessistemasvisamaobtençãoda
formade um objeto por meio dos pontos dispostos através dos mar os. Primeiramente,
deve-se retirar os efeitos de lo ação. Contudo, para remover a lo ação daforma deve-se
denirasubmatrizde Helmert(
H
). Amatrizde Helmert(H
F
)éumamatrizquadráti a
ortogonal
k × k
omaprimeiralinhadeelementos iguala1/
√
k
,então aj
-ésimalinha(j
-1)elementosiguaisa1/
pj(j − 1)
seguidoporumelementoiguala(j − 1) × 1/pj(j − 1)
e(k − j)
zeros. A sub-matriz de Helmert é a matriz de Helmert sem a primeira linha. Por exemplo,parak
=4 amatriz de Helmert éH
F
=
1/2
1/2
1/2
1/2
−1/
√
2
1/
√
2
0
0
−1/
√
6
−1/
√
6
2/
√
6
0
−1/
√
12 −1/
√
12 −1/
√
12 3/
√
12
ea sub-matriz de Helmert será
H
=
−1/
√
2
1/
√
2
0
0
−1/
√
6
−1/
√
6
2/
√
6
0
−1/
√
12 −1/
√
12 −1/
√
12 3/
√
12
Para remover a lo ação do vetor omplexo
z
0
, basta multipli ar o vetor pela
sub-matriz de Helmert (
H
) de dimensão(k − 1) × k
. A onguração Helmertizada é dada porw
(k−1×1)
= H
(k−1×k)
z
(k×1)
0
(2.4)onde
w
representa a onguraçãoz
0
sem o efeitode lo ação.
Pode-se reverter de volta aos mar os entrados de um mar o Helmertizado por
pré-multipli arpor
H
⊤
, omoH
⊤
H
=
I
k
−
1
k
1
k
1
⊤
k
Dessa forma,pré multipli ando ovetor
w
porH
⊤
obtém-se a onguração entrada
H
⊤
w
= H
⊤
Hz
0
=
I
k
−
1
k
1
k
1
⊤
k
z
0
= z
0
−
1
k
k
X
j=1
z
(j)
0
1
k
(2.5)Paraexempli ar,tem-sea onguraçãomatemáti adeumindivíduoobtidodosdados
degorilasma hos,(DRYDEN;MARDIA,1998),emque
z
0
= (53+220i, 46−35i, 0+0i, 0+
37i, 12 + 122i, 58 + 204i, 93 + 117i, 103 + 28i)
⊤
. A Figura2.1representaas ongurações
original, Helmertizada e entralizada para mar os de um gorila ma ho. Vale notar que
a onguração Helmertizada, Figura 2.1b, perde a dimensão original dos dados. Este
problema é orrigido om amultipli ação por
H
⊤
Figura 2.1: Congurações de um gorila ma ho.
Fonte: Oliveira(2016).
Para removeroefeitode es aladeve-se dividira onguraçãoHelmertizada,obtidana
expressão(2.4), pela sua norma. Sendo assim,
z
k−1×1
=
w
|w|
=
w
√
w
∗
w
=
H
(k−1×k)
z
(k×1)
0
q
(H
(k−1×k)
z
0
(k×1)
)
∗
(H
(k−1×k)
z
(k×1)
0
)
(2.6) ondew
∗
éo transposto do onjugadode
w
e|·
| denotaanorma omplexa dew
. Ovetorz
, de a ordo om Kendall(1984), é hamadode pré-forma da onguração omplexaz
0
.
Éimportantenotar que apré-forma éuma forma om oefeito de rotaçãoretido.
Devido a importân ia da pré-forma no estudo das oordenadas de Kendall, alguns
on eitos relevantes devemser onsiderados.
Denição2.1. (Pré-forma). Aspré-formasdeuma matrizde onguração
X
, da Equa-ção (2.1), é dado porz
k−1×m
=
H
(k−1×k)
X
(k×m)
|HX|
(2.7)o qual é invariante sob lo ação e es alada onguração original.
A partirdaEquação (2.7)pode-seobter aspré-formas entralizadasde formaque
z
C
e
(k×m)
= C
e·(k×k)
X
k×m
/|C
e
X
|
desde que
C
e
= H
⊤
H
. Note que
z
é uma matriz(k − 1) × m
enquanto quez
c
e
éuma matriz
k × m
. A vantagem em usarz
é por ser de posto ompleto e sua dimensão é menor do que dez
c
e
. Em ontrapartida, há uma vantagem de trabalhar om apré-forma entralizada
z
c
e
,pois arepresentação das oordenadas Cartesianasé oerente omO espaço das pré-formas é o espaço de todas as possíveis pré-formas
z
, ou seja, o espaço de todos os possíveis vetores de dimensão(k − 1)
que não possuem a informação dalo ação e es ala. Para pré-formas planas, este espaço é uma hiperesfera omplexa dedimensão
(k − 1)
,isto éC
S
k−2
= {z : z
∗
z
= 1, z ∈ C
k−1
}
(2.8)emque
C
k−1
é o espaço ompleto de dimensão
(k − 1)
.Denição2.2. (Forma). Aforma deumamatriz de onguraçãoX étodaa informação
geométri a sobre X que é invariante sobre lo ação, rotação e es ala. A forma pode ser
representada omo
[z] = {e
iθ
z
: θ ∈ [0, 2π)}
(2.9)emque
θ
é o grupo espe ial ortogonalde rotações e z é a pré-formade X.Para
m = 2
oespaçodaformaéespaçoprojetivo omplexoC
P
k−2
,oespaçode linhas
omplexasque passampelaorigem.
Denição 2.3. (Í one). Um í one é um membro parti ular do onjunto de formas [
z
℄ o qual é tomado omo sendo a representatividade da forma.Apalavraí oneindi aimagemousemelhança eéapropriado omousopararetratar
umaimagemrepresentativadeuma lasseequivalentedaformaoqualpossui`semelhança'
paraoutrosmembros,istoé,osobjetosda lassesãotodossimilares. Apré-forma entrada
z
c
e
é uma es olha apropriada de í one. Dessa forma, iremos usar a pré-forma entrada para ter uma representação da onguraçãooriginal.2.1.2 Distân ia Pro rustes para aso planar
Oobjetivo desta seçãoé apresentaralguns on eitos bási os paraamostras aleatórias
de objetos. Alguns desses aspe tos de análise de formasão: obter aestimativa da forma
médiadeumaamostraaleatória,o ál ulode distân iasentre formas, osresíduosde ada
objeto emrelaçãoa um grupo.
Umimportante on eitode análisede formaéestimaraformamédiade umaamostra
aleatóriade ongurações. Considere
z
0
1
, . . . , z
0
n
omo uma amostraaleatóriade ongu-rações omplexasdeumapopulaçãoden
objetosouindivíduosoqualz
0
i
foidenidopela Equação (2.3).De a ordo om Kent (1994) obtém-se o seguinte resultado para estimação da forma
média Pro rustes ompleta
µ
ˆ
para formas planas.Resultado 2.1. A forma média Pro rustes ompleta
µ
ˆ
pode ser en ontrada omo o autovetor orrespondenteao maior autovalor da soma quadráti a omplexa e matrizproduto
S
=
n
X
i=1
w
i
w
∗
i
/(w
i
∗
w
i
) =
n
X
i=1
z
i
z
∗
i
,
(2.10)onde
z
i
= w
i
/||w
i
||, i = 1, . . . , n
são as pré-formas.Assim,
µ
ˆ
é dado pelo autovetor omplexo orrespondente ao maior autovalor, ou autovetor dominantedeS
. O autovetor é úni o (até uma rotação- todas rotaçõesdeµ
ˆ
são também soluções, mas todos este orrespondem a mesma forma), desde que existaum úni o autovalor maior de
S
. A forma média de dados dos gorilas 29 ma hos e 30 fêmeas (DRYDEN; MARDIA, 1998)são apresentados naFigura2.2.Figura2.2: A formamédia Pro rustes ompleta de gorilasma hos e fêmeas.
Fonte: Oliveira(2016).
A onguração possui uma rotação arbitrária (DRYDEN; MARDIA, 1998). Assim,
é ne essário rota ionar todas ongurações de tal forma que eles estarão tão próximos
quantopossíveldaformamédiaamostral. Dessaforma,dene-se queoajuste
Pro rus-tes ompleto ou oordenadas Pro rustes ompletade
w
1
, . . . , w
n
sãow
P
i
=
w
∗
i
µw
ˆ
i
w
∗
i
w
i
onde ada
w
P
i
é o ajuste Pro rustes ompleto dew
i
emµ
ˆ
. A forma média Pro rus-tes ompleta pode ser obtida por tomar a média aritméti a das oordenadas Pro rustesompleta, ouseja,
1
n
P
n
i=1
w
i
P
tem a mesmaforma omo a formamédia Pro rustesµ
ˆ
.Osresíduos Pro rustes são al ulados omo
r
i
= w
i
P
−
1
n
n
X
i=1
w
i
P
!
, i = 1, . . . , n
(2.11)eos resíduosPro rustes são usados para investigar avariabilidadeda forma.
Um on eito de distân iaentre duas formas é ne essário para denir ompletamente
oespaço métri ode formanão-Eu lidiana.
Considere duas matrizes de onguração
k
pontose dimensãom
=2,X
eY
, esuas ongurações entradase de tamanhounitário(pré-forma entrada)z
x
= (z
x1
, . . . , z
xk
)
⊤
e
z
y
= (z
y1
, . . . , z
yk
)
⊤
,de duas ongurações
X
eY
onde||z
x
|| = 1 = ||z
y
||
ez
∗
x
1
k
= 0 =
z
∗
y
1
k
. Dessa forma,adistân ia de Pro rustes ompletaentre duas formasz
x
ez
y
éd
2
F
= 1 − |z
∗
x
z
y
|
2
(2.12)Esta distân ia é invariante aos efeitos de lo ação, es ala e rotação. Consequentemente,
podemos onsiderar
cos ρ = (1 − d
2
F
)
1/2
.Paradadosnoplano,oespaçopré-formaéumaesfera omplexa
C
S
k−2
deraiounitário
em dimensão omplexa
k − 1
denido na Equação (2.8). O ângulo entre as pré-formas omplexasz
x
ez
y
éρ = arccos(|z
x
∗
z
y
|)
(2.13)Essa quantidade também denominada omo geodési a é denida omo o aminho mais
urtoentre
z
x
ez
y
nahiperesferadapré-formaenão éafetadapelarotação(ZELDITCH; SWIDERSKI; SHEETS, 2012). Consequentemente, pode-se ver expli itamente que adistân ia de Pro rustes
ρ
éo ânguloentre aspré-formasz
x
ez
y
. Também, desdeque o raio da esfera da pré-forma é 1, pode-se onsiderarρ
a distân ia ótima no ír ulo na esfera dapré-forma.Adistân ia de Pro rustes Par ialtambéméinvariantequantoarotaçãoentre
z
x
ez
y
eé dada pord
2
P
= 2(1 − |z
x
∗
z
y
|) = 2(1 − cos ρ)
(2.14)pré-forma.
Figura2.3: Ilustração darelação entre as distân ias
d
F
,ρ
ed
P
naesfera dapré-forma.Fonte: Oliveira(2016).
2.1.3 Coordenadas no Espaço Tangente
O espaço tangente éa versão linearizada do espaço de formas naproximidade de um
pontoparti ulardoespaçodeforma. Umadasvantagensdoespaçotangenteéquepodem
ser usadas asté ni as padrão de análise multivariada. Existem vários tiposdiferentes de
oordenadasnoespaço tangente. Serão onsideradasas oordenadas tangentePro rustes
par ial.
Considere
x
1
, . . . , x
n
uma amostra de ongurações. Dessa forma, as oordenadas tangentes serãot
i
= exp
iθ
[I
k−1
− ˆ
µ
µ
ˆ
∗
]z
i
, i = 1, . . . , n
(2.15)onde
z
i
é a pré-forma orrespondente a onguraçãox
i
denida em (2.7),θ
ˆ
minimiza|| ˆ
µ
− z exp
iθ
||
2
e
||z|| =
√
z
∗
z
.
Suponhaque
z
1
, . . . , z
n
éuma amostraaleatória de pré-formaset
1
, . . . , t
n
suas oor-denadas tangentes. Sejav
i
um vetor2k − 2
o qualéobtido porempilharas oordenadas real eimagináriade adat
i
. Essa operação érepresentada porcvec
ondeAssim, o vetor de pré-formas
z
i
∈ C
k−1
é representado nas oordenadas tangentes
pelo vetor
v
i
∈ R
2k−2
. A distân ia Eu lidiana no espaço tangente para o espaço de
formas é uma boa aproximação para situações de alta on entração, ou seja, variân ia
pequena ((DRYDEN; MARDIA, 1998), p.76) das distân ias de Pro rustes
d
F
, ρ
ed
P
. E assim,pode-se apli aros métodos multivariadospadrõesnas oordenadastangentes.As oordenadas tangentes par ial possuem grande utilidade nas análises de formas,
umavez quepode-seutilizarasdiversasté ni asmultivariadasnoespaçoEu lidiano.
En-tretanto,pesquisadores já mostraram sua ine iên ia em dados om baixa on entração.
Como por exemplo, os testes de hipóteses das formas médias das pré-formas propostas
porAmaral, DrydeneWood(2007)earegiãode onançabootstrapparaaformamédia
planar,desenvolvida porAmaral et al.(2010).
2.2 Algoritmo
k
-médias para formasDea ordo omAmaraletal.(2010),paradadosusuais,oalgoritmo
k
-médiasobjetiva parti ionarn
observaçõesdentrek
gruposdemodoque adaobservaçãopertençaaogrupo ujadistân iaentre essa observação e oprotótipo(representante) dogrupoé mínima. Otermo
k
-means foi usado primeiramente em 1967 por James Ma Queen em seu artigo intitulado Some Methods for Classi ation and Analysis of Multivariate Observation.Noanode1957,SturatLlodypropsoalgoritmoStandardAlgorithm omoumaté ni a
de modulação de pulso que não tinha sido publi ado fora dos laboratórios Bell até 1982.
Oalgoritmoé onhe ido omoLlody Forgypoisem1965 E.W. Fordypubli ouomesmo
algoritmo. Entre 1975 e 1979, uma versão mais e iente foi proposta e publi ada em
Fortranpor Hastigan eWong.
Seja um onjunto de
n
objetos ou indivíduos a ser agrupados em um onjunto dek
grupos,C = (C
r
, r = 1, . . . , k)
. Oalgoritmok
-médiasen ontraumapartiçãominimizando um ritérioquemededistân iaentrepré-formasdegruposeformasmédia(FormamédiaPro rustes ompleta).
J(C
r
) =
X
i∈C
r
d
2
(z
i
, µ
r
)
ondeafunçãod
2
éumamedidade distân iageral omoasdistân ias denidasem(2.12),
Oobjetivo do
k
-médias éminimizara soma doerro quadráti o sobre todo lusterk
,J(C) =
k
X
r=1
X
i∈C
r
d
2
(z
i
, µ
r
)
(2.16)Oalgoritmoa seguir resumeo passoa passo iterativopara obter oagrupamentopelo
método
k
-médias emanálise de formas.Algoritmo 1:Método de Agrupamento
k
-médias para formas planas Entrada: Pré-formaz
( omo denido na Equação (2.6)),número de gruposk
ealo ação ini ial;
Saída: Grupos
C
r
(1 ≤ r ≤ k)
;1 Obtenha a formamédia para ada grupo;
2 Atribua ada objetoa formamédia dogrupomais próximo, através das Equações
(2.12),(2.13) ou(2.14);
3 Cal ulea formamédia de ada grupo;
4 Repita opasso 2 e 3até quea formamédia não mude ouum valorótimo da
Equação (2.16)seja en ontrada.
Esse algoritmo move os objetos entre os agrupamentos até que não haja alteração
signi ativanafunçãoobjetivo,ouatéqueonúmerodeiteraçõesmáximoprédeterminado
sejaal ançado. Oresultado é um onjuntode grupos om indivíduos om ara terísti as
homogêneasdentrodos grupos e om ara terísti as heterogêneas entre osgrupos.
Apesardoalgoritmo onvergirrapidamenteparaumasolução,essasoluçãoen ontrada
depende daalo açãoini ial, logoo métodopode onvergir paraum ótimo lo al. Trata-se
de um métodopráti oe omputa ionalmentee iente, porémé sensívela ruído epontos
aberrantes, porexemplo.
2.3 Funções kernel
Desde o iní io da última dé ada, muitos pesquisadores têm demonstrado interesse
em métodos baseados emkernel (FILIPPONE et al., 2008). A prin ipal ideia por trás
desses métodos é o uso de um mapeamento não-linear arbitrário
Φ
do espaço original dasobservaçõespara umespaço demais altadimensão (possivelmenteinnita), hamadoespaço de ara terísti as,
F
. Nesta seção, apresentamos uma breve revisão a er a da teoriabási a sobre funções kernel.Seja
X
= {x
1
, . . . , x
n
}
um onjunto não-vazio, ondex
i
∈ R
p
,
∀i
. Uma funçãoh :
X
× X → R
édita um kernel positivo-denido (ou kernel de Mer er) se, e somente se,h
é simétri a(isto é,h(x
i
, x
k
) = h(x
k
, x
i
)
) e a seguintedesigualdade é válida (MERCER, 1909):n
X
i=1
n
X
k=1
c
i
c
k
h(x
i
, x
k
) ≥ 0 ∀n ≥ 2,
(2.17) ondec
r
∈ R ∀r = 1, . . . , n
.Um onjunto de observações não-linearmenteseparável pode tornar-se separável
line-armente através de um mapeamento não-linear arbitráriopara um espaço de
ara terís-ti as de alta dimensão (HAYKIN, 1998). Seja
Φ : X → F
um mapeamento não-linear arbitrário do espaço original das observações para um espaço de ara terísti as de altadimensão
F
. Apli andoo mapeamentonão-linearΦ
, oproduto internox
⊤
i
x
k
no espaço originalémapeado paraΦ(x
i
)
⊤
Φ(x
k
)
noespaçode ara terísti as. A essên ia dos méto-dos baseados em kernel é que o mapeamentonão-linearΦ
não pre isaser expli itamente espe i ado porque todo kernel de Mer er pode ser expresso omoh(x
i
, x
k
) = Φ(x
i
)
⊤
Φ(x
k
),
(2.18)queé usualmentereferida omo kernel tri k.
Por ausa da Equação (2.18), é possível al ular distân ias Eu lidianas em
F
da seguintemaneira:||Φ(x
i
) − Φ(x
k
)||
2
= (Φ(x
i
) − Φ(x
k
))
⊤
(Φ(x
i
) − Φ(x
k
))
= Φ(x
i
)
⊤
Φ(x
i
) − 2Φ(x
i
)
⊤
Φ(x
k
) + Φ(x
k
)
⊤
Φ(x
k
)
= h(x
i
, x
i
) − 2h(x
i
, x
k
) + h(x
k
, x
k
).
(2.19)Exemplos de funções kernel tipi amenteutilizadas são:
•
Linear:h(x
i
, x
k
) = x
⊤
i
x
k
,•
Polinomialde graud
:h(x
i
, x
k
) = (γx
⊤
i
x
k
+ θ)
d
,γ > 0
,θ ≥ 0
,d ∈ N
,•
Gaussiana:h(x
i
, x
k
) = e
−
||xi−xk||2
2σ2
,σ > 0
,•
Lapla iana:h(x
i
, x
k
) = e
−γ||x
i
−x
k
||
,γ > 0
,•
Sigmóide:h(x
i
, x
k
) = tanh(γx
⊤
i
x
k
+ θ)
,γ > 0
,θ ≥ 0
,2.4 Agrupamento Espe tral
Osmétodos de agrupamentoespe tral rela ionam-se om teoria dos grafos(SHA
WE-TAYLOR; KANDOLA, 2001). Uma omparação de alguns métodos de agrupamento
es-pe tral foi apresentada por Verma eMeila (2003). Seja
X
= {x
1
, . . . , x
n
}
o onjuntode obervaçõesaseremagrupadas. Ini iandoapartirdeX
,podemos onstruirumgrafo om-pleto,ponderadonão-dire ionadoG(V, A)
ontendoum onjuntode nósV = {v
1
, . . . , v
n
}
orrespondendo àsn
observações e arestas denidas através da matriz de adja ên iaA
(também hamada de anidade), de dimensãon × n
. A matriz de adja ên ia para um grafoponderado édada pelamatriz ujoelementoa
ij
representa opesodaarestaqueliga os nósi
ej
. Sendo um grá o não-dire ionado, a propriedadea
ij
=a
ji
é verdadeira. A adja ên iaentre duas observações pode ser denida daseguinteforma:a
ij
=
h(x
i
, x
j
),
sei 6= j;
0,
aso ontrário.
(2.20)onde a função
h(x
i
, x
j
)
mede a similaridade entre duas observaçõesi
ej
. Comumente, umafunção kernel gaussiana éusada:h(x
i
, x
j
) = exp
−
d
2
(x
i
, x
j
)
2σ
2
,
(2.21) onded
2
(x
i
, x
j
) = ||x
i
− x
j
||
2
mede a dissimilaridade entre duas observaçõesi
ej
eσ
2
ontrola a velo idade de deterioraçãode
h
. Esta parti ular es olha tem apropriedadede queA
tem apenas algunstermos signi ativamentediferentes de0
,ouseja,A
éesparsa. A matrizde grauD
é amatriz diagonal ujos elementossão osgraus dos nós deG
,d
ii
=
n
X
j=1
a
ij
.
(2.22)Neste ontexto, o problema de agrupamentopode ser visto omo um problema de orte
(CHUNG,1996), ondese deseja separar um onjunto de nós
S ⊂ V
do onjunto omple-mentarS = V \ S
¯
. O problemade orteno grafopode ser formuladode várias maneiras, dependendo da es olha da função objetivo a otimizar. Uma das mais populares funçõespara otimizar(CHUNG,1996) é:
cut(S, ¯
S) =
X
v
i
∈S,v
j
∈ ¯
S
a
ij
.
(2.23)ontendo os nós isolados. Para onseguir um melhor equilíbrio na ardinalidade de
S
e¯
S
, sugere-se a otimização dafunção de orte normalizada(SHI; MALIK, 2000):Ncut(S, ¯
S) = cut(S, ¯
S)
1
assoc(S, V )
+
1
assoc( ¯
S, V )
,
(2.24)emquea asso iação
assoc(S, V )
étambém onhe ido omo ovolume deS
:assoc(S, V ) =
X
v
i
∈S,v
j
∈V
a
ij
≡ vol(S) =
X
v
i
∈S
d
ii
.
(2.25)Há outrasdenições de funções para otimizar,porexemplo, a ontundên ia (KANNAN;
VEMPALA; VETTA, 2004),a asso iaçãonormalizada (SHI;MALIK, 2000) ea razãode
orte(DHILLON; GUAN; KULIS,2004).
A omplexidade em otimizar essas funções objetivo é muito elevada (por exemplo,
a otimização do orte normalizado é NP-Hard (SHI; MALIK, 2000; WAGNER; W
AG-NER, 1993)) e por esta razão, tem-se pro urado usar on eitos espe trais de análise de
grafos. Estes on eitos podem ser formulados a partir da introdução da matriz
Lapla i-ana (CHUNG,1996):
L
= D − A,
(2.26)que pode ser visto omo um operador linear em
G
. Além desta denição de matriz Lapla iana,existem outras denições alternativas:•
Lapla ianaNormalizada, dada porL
N
= D
−1/2
LD
−1/2
;
•
Lapla ianaGeneralizada, dada porL
G
= D
−1
L
;
•
Lapla ianaRelaxada, dada porL
ρ
= L − ρD
.Cadadeniçãoéjusti adaporpropriedadesespe iaisdesejáveisemumdeterminado
on-texto. A de omposição espe tral da matriz Lapla iana pode forne er informações úteis
sobreaspropriedadesdografo. Emparti ular, pode ser vistoque osegundo menor
auto-valorde
L
está rela ionado om o orte nografo (FIEDLER,1973) eos orrespondentes autovetorespodemagruparobservaçõessemelhantes(CHUNG,1996;SHI;MALIK,2000;BRAND;HUANG, 2003).
O problema da redução de dimensionalidade tem omo objetivo en ontrar uma
re-presentação dimensional adequada de um onjunto de dados em um espaço dimensional
elevado. Em Belkin e Niyogi (2003), ada nó no grafo, que representa uma observação,
espe tral da matriz Lapla ianadografo obtido permite en ontrar uma representação
di-mensionalbaixade
X
.São inúmerososalgoritmosqueforamdesenvolvidos para resolveroproblema de
par-ti ionamentode dadospormeiode métodos espe trais. Dentre eles, podem ser itadosos
algoritmode Shi &Malik(SHI; MALIK,2000),Ng, Jordan&Weiss, Perona&Freeman,
dentre outros (WAGNER; WAGNER, 1993; FILIPPONE et al., 2008). Neste trabalho,
fo aremosnautilizaçãodoalgoritmoespe tral Ng,Jordan &Weiss, adaptadopara
agru-pardadosdeformas e omparando-o om aadaptaçãoparadadosdeformasdoalgoritmo
k
-médias, proposta porAmaral etal. (2010).2.4.1 Algoritmo de Ng, Jordan & Weiss
O algoritmo de Ng, Jordan & Weiss utiliza autovetores da matriz Lapla iana, além
de, através doalgoritmo
k
-médias,obter uma partiçãodo onjuntode observações (MO-RAIS, 2012). É des rito abaixo, o roteiro do algoritmo para um onjunto de dadosAlgoritmo 2:Algoritmo Ng, Jordan & Weiss
Entrada: Conjuntode observações
X
= {x
1
, . . . , x
n
}
enúmero de gruposk
; Saída: GruposC
r
(1 ≤ r ≤ k)
;1 Cal ulematriz de adja ên ia
A = [a
ij
] ∈ R
n×n
,a
ij
=
exp
−
d
2
(x
i
, x
j
)
2σ
2
,
sei 6= j;
0,
aso ontrário,
onded
2
(x
i
, x
j
)
representa a distân iaeu lidiana quadradaentre duas observaçõesi
ej
. Como um ritériopara aes olha deσ
2
diversos autores sugerem uma bus a
em um grid;
2 Cal ulea matriz Lapla iananormalizada
L
= D
−1/2
AD
−1/2
;
3 En ontre os
k
autovetores deL
asso iados aos seusk
maioresautovalores;4 Construa uma matriz
Z
on atenando osk
autovetores asso iados aosk
maiores autovalores deL
;5 Obtenha a matriz
Y
através deZ
, apli andoy
ij
= z
ij
/
P
k
r=1
z
ir
2
, fazendo om que todas as linhasdeZ
tenhamnorma unitária. Este pro edimento mapeia os pontosoriginais para uma esfera unitária;6 Usando
Y
,obter os grupos utilizandooalgoritmok
-médias lássi o;7 Atribuiro ponto original
x
i
aogrupoj
se e sóse alinhai
damatrizY
perten er aogrupoj
.Podendo ser vista omo um grafo,a matriz de anidade ligaentre si assuas linhas e
as olunas, representando as ligações entre os vérti es de um grafo, em que o valor dos
ampos damatriz representa os própriosvérti es.
2.4.2 Agrupamento espe tral para dados de formas
No ontexto de análise de dados de formas, um kernel de Mer er ou kernel
positivo-denido é obtido quando substituímos a distân ia eu lidiana no kernel gaussiano pela
distân iade pro rustes ompleta,resultandonoentão hamadokernelgaussiano
pro rus-tes (JAYASUMANA etal.,2013).
A função kernel gaussiana pro rustesé
h(z
i
, z
j
) = exp
−
d
2
F
(z
i
, z
j
)
2σ
2
= exp
−
1 − |(z
∗
i
z
j
)|
2
2σ
2
(2.27)positivodenido para todo
σ
2
∈ R
+
.
Apropostadonossotrabalho onsistenaadaptaçãodo ál ulodamatrizdeadja ên ia
no algoritmo de Ng, Jordan & Weiss om base na função kernel, usando a distân ia de
Pro rustes Completa. Além disso, o algoritmode agrupamento espe tral de Ng, Jordan
&Weiss, usualmente utilizado emdados lássi os,foi utilizadopara análise de dados de
APLICAÇÕES
3.1 Introdução
Neste apítuloserãoapresentadasades riçãodediversos onjuntosdedadosdeformas
extraídosdos pa otesshapes,geomorph emomo s, dosoftware estatísti o R, juntoa uma
omparação do método proposto (Ng, Jordan & Weiss para dados de formas planas)
om o algoritmo
k
-médias para formas proposto por Amaral et al. (2010). A Tabela 3.1 apresenta os onjuntosde dados utilizados no estudo, suas dimensões e o número degrupos, apriori, de ada onjuntode dados.
Tabela 3.1: Conjunto de dados utilizados no estudo, formato dos dados e número de
grupos de ada onjunto.
Dados Formato Númerode grupos
Cérebros de esquizofrêni os e não-esquizofrêni os 8
×
2×
30 2Vértebra de amundongos 6
×
2×
76 3Crânios de gorilas 8
×
2×
59 3Crânios de ma a os 7
×
3×
18 2Crânios de grandes primatas 8
×
2×
167 3Cérebros de adultos saudáveis 24
×
3×
58 2Crânios de himpanzés 8
×
2×
54 2Crânios de orangotangos 8
×
2×
60 2Grãos de areia 50
×
2×
49 2Cabeças de salamandras 12
×
2×
40 2Asas de mosquito 18
×
2×
40 2Caudas de salamandras larvais 17
×
2×
64 6Glumas de ereais 21
×
2×
172 3Foirealizadauma bus a emgrid para seen ontrar o valorótimo doparâmetro
σ
2
do
kernel Gaussiano, em ada apli ação, e os melhores valores para esses parâmetros estão
apresentados na Tabela3.2. A denição dogrid para abus a foi feitade formaempíri a
para ada onjunto de dados. Por exemplo, para o onjunto de dados de érebros de
esquizofrêni os ede nao-esquizofrêni os, variamosovalorde
σ
2
entre
0.001
e1
por0.001
para os dois métodos, enquanto que para os dados de rânios de himpanzés, o melhorvalor de
sigam
2
foi en ontrado no intervalo entre
0.1
e1
por0.1
para o algoritmo Ng, Jordan & Weiss om a distân ia de pro rustes ompleta e entre1
e10
por0.1
para o algoritmoNg,Jordan & Weiss no espaço tangentedas formas.Tabela3.2: Parâmetros
σ
2
do kernel Gaussiano apli adosà ada onjuntos de dados por
meio doalgoritmoNg,Jordan & Weiss.
Dados Parâmetros da Função kernel
Ng, Jordan &Weiss Ng,Jordan & Weiss
Pro rustes Completo Eu lid. esp. tang.
Cérebros de esquiz. e não-esquiz. 0.001 0.001
Vértebra de amundongos 0.0001 5
Crâniosde gorilas 0.1 0.1
Crâniosde ma a os 0.001 0.001
Crâniosde grandes primatas 0.25 0.25
Cérebros de adultos saudáveis 0.25 0.25
Crâniosde himpanzés 0.5 10
Crâniosde orangotangos 0.5 10
Grãos de areia 1 1
Cabeças de salamandras 0.01 0.1
Asas de mosquito 0.1 1
Caudas de salamandras larvais 0.0001 0.0001
Glumas de ereais 1 0.001
Corações desenhados a mão 0.0001 0.0001
3.1.1 Índi es de avaliação
Para omparar os métodos de agrupamento onsiderados nestetrabalho, utilizamoso
Índi e de Rand Ajustado (IRA) (HUBERT; ARABIE, 1985) e a taxa total de erro de
alo ação(TEA) (BREIMAN et al.,1984).
Seja
P = {P
1
, . . . , P
i
, . . . , P
c
}
apartiçãoapriori deΩ = {1, . . . , n}
emc
lassesesejaP = {P
1
, . . . , P
k
, . . . , P
K
}
uma partiçãorígida deΩ = {1, . . . , n}
emK
gruposforne idos por um algoritmo de agrupamento. As quantidadesn
ik
,i = 1, . . . , c
,k = 1, . . . , K
, representam o número de observações que estão na lasseP
i
e no grupoP
k
e podem ser representadas na formadaTabela3.3, denominada matrizde onfusão.Tabela3.3: Matriz de onfusão. Grupos Classes
P
1
· · ·
P
k
· · ·
P
K
P
P
1
n
11
· · ·
n
1k
· · ·
n
1K
n
1•
=
P
K
k=1
n
1k
. . . . . .· · ·
. . .· · ·
. . . . . .P
i
n
i1
· · ·
n
ik
· · ·
n
iK
n
i•
=
P
K
k=1
n
ik
. . . . . .· · ·
. . .· · ·
. . . . . .P
c
n
c1
· · ·
n
ck
· · ·
n
cK
n
c•
=
P
K
k=1
n
ck
P
n
•1
=
P
c
i=1
n
i1
· · ·
n
•1
=
P
c
i=1
n
i1
· · ·
n
•1
=
P
c
i=1
n
i1
n =
P
c
i=1
P
K
k=1
n
ik
OÍndi e de Rand Ajustado (IRA) é obtido omo
CR =
P
c
i=1
P
K
k=1
n
ik
2
−
n
2
−1
P
c
i=1
n
i•
2
P
K
k=1
n
•k
2
1
2
h
P
c
i=1
n
i•
2
+ P
K
k=1
n
•k
2
i
−
n
2
−1
P
c
i=1
n
i•
2
P
K
k=1
n
•k
2
,
(3.1) onden
2
=
n(n−1)
2
,n
ik
representa o número de observações que estão na lasseP
i
e no grupoP
k
,n
i•
representa o número de observações na lasseP
i
,n
•k
representa o número de observações nogrupoP
k
, en
é onúmerototal de observaçõesno onjunto de dados.OIRA avaliaograude on ordân ia(similaridade)entreumapartiçãoapriori euma
partiçãoforne idaporum métodode agrupamento. Alémdisso, o IRA não é sensível ao
númerode lassesnaspartiçõesouàdistribuiçãodasobservaçõesnosgrupos. Finalmente,
oIRA assumevalores nointervalo
[−1, 1]
, no qualo valor1 indi a on ordân iaperfeita entre as partições, enquanto que valores próximos de zero ou negativos orrespondem aon ordân iaentre partiçõesen ontrada ao a asoMilligan(1996).
Em problemas de lassi ação, ada grupo
P
k
é asso iado a uma lasse a prioriP
i
e estaasso iação deveser interpretada omo seaverdadeira lassea priori fosseP
i
. Dessa forma,para uma observação perten ente aum dadogrupoP
k
ade isão está orretase a lasseaprioridessaobservaçãoéP
i
. Paraobterumataxadeerrode lassi açãomínima, pre isamos en ontrar uma regra de de isão que minimizeaprobabilidade de erro.Seja
ℓ(P
i
, P
k
)
aprobabilidadea posteriori dequeumaobservação pertençaà lasseP
i
quando asso iadoao grupoP
k
. Sejaℓ(P
k
)
a probabilidadede que a observação pertença aogrupoP
k
. A funçãoℓ
é onhe ida omo função de verossimilhança.posteriori
ℓ(P
i
, P
k
)
e oíndi e da lasse a priori asso iadaa esta modaédada porMAP (P
k
) = arg max
1≤i≤c
ℓ(P
i
, P
k
).
A regra de de isão de Bayes que minimiza a probabilidade média de erro é sele ionar a
lassea priori que maximizaaprobabilidadea posteriori. Ataxa de erro de alo açãodo
grupo
P
k
éigual a1 − ℓ(P
M AP (P
k
)
/P
k
)
ea taxatotalde erro de alo ação(TEA) é igualaT EA =
K
X
k=1
ℓ(P
k
)(1 − ℓ(P
M AP (P
k
)
/P
k
)).
Para uma amostra,
ℓ(P
M AP (P
k
)
/P
k
) = max
1≤i≤c
n
ik
/n
•k
.
A taxa total de erro de alo ação (TEA) foi on ebida de modo amedir a habilidade
de um algoritmode agrupamentoen ontrar as lasses apriori presentes emum onjunto
de dados eé al ulada da forma:
T EA =
K
X
k=1
n
•k
n
1 − max
1≤i≤c
n
ik
/n
•k
= 1 −
P
K
k=1
max
1≤i≤c
n
ik
n
.
(3.2)Oíndi eTEAassumevaloresnointervalo
[0, 1]
,noqualvalorespróximosdezeroindi am maiorhabilidade de um algoritmonadete ção de lasses a priori.3.2 Apli ações
Esta seção ompreende na omparação dos algoritmos
k
-médias (4) e Ng, Jordan & Weiss (7) apli ados a onjuntos de dados de formas. Os resultados para 14 onjuntode dados foram apresentados em tabelas, onsiderando os índi es de avaliação IRA e
TEA, denidos outrora,para as distân ias de Pro rustes, Pro rustes Par ial, Pro rustes
Completa edistân iaeu lidiana no espaçotangente.
Na Tabela3.4, dispomos um resumoa er a dodesempenho dos métodos omparados
onsiderandoaspossíveisdistân iasqueosalgoritmospermitemutilizar. A partirdos
re-sultadosdosdoisíndi esdeavaliação,desta amos, omo ír uloha hurado(
•
),ométodo queapresentouvaloressuperioresemrelaçãoaosdemais. Osmétodos(edistân ias)onsi-deradossão