De modo similar a outras t´ecnicas interativas, a LAMP faz uso de um subconjunto de amostras ou pontos de controle, e de sua localiza¸c˜ao no espa¸co visual. A informa¸c˜ao obtida a partir dos pontos de controle ´e usada para construir uma fam´ılia de mapeamentos ortogonais afins, um para cada instˆancia a ser projetada. O usu´ario pode manipular os pontos de controle no espa¸co visual para melhor organiz´a-los. Da´ı em diante o mapea- mento segue o layout dos pontos de controle. Em outras palavras, o usu´ario pode guiar a proje¸c˜ao com base nos pontos de controle. A Figura 4.1 ilustra as etapas deste processo.
Figura 4.1: Os trˆes m´odulos principais que comp˜oem o framework da LAMP.
A formula¸c˜ao matem´atica da LAMP n˜ao se baseia em grafos de vizinhan¸ca e ad- mite um n´umero bem reduzido de amostras como entrada. Sua formula¸c˜ao usa Singular Value Decomposition (SVD) para resolver um problema de minimiza¸c˜ao conhecido. A Se¸c˜ao 4.2.1 descreve as etapas dessa formula¸c˜ao e c´alculo do mapeamento afim, enquanto que a Se¸c˜ao 4.2.2 faz uma an´alise de como os pontos de controle influenciam na proje¸c˜ao.
4.2 Local Affine Multidimensional Projection (LAMP) 79 4.2.1 Formula¸c˜ao Matem´atica e C´alculo do Mapeamento Afim
Considere o conjunto de dados X ⊂ Rm contendo n instˆancias, X
S ={x1, x2, . . . , xk} um subconjunto de pontos de controle de X, e seja xi ∈ XS um representante desse subconjunto. A imagem de XS no espa¸co visual (R2 neste contexto) representa-se por YS = {y1, y2, . . . , yk}. Ent˜ao, dada uma instˆancia x ∈ X, a t´ecnica Local Affine Multidi- mensional Projection (LAMP) mapeia x para o espa¸co visual encontrando a transforma¸c˜ao afim fx(p) = pM + t que minimiza Elamp= k X i=1 αikfx(xi)− yik2, restrito `a M⊤M = I, (4.1)
onde a matriz M e o vetor t s˜ao desconhecidos, I ´e a matriz identidade, e αi s˜ao pesos escalares definidos como:
αi = 1 kxi− xk2
. (4.2)
O problema de minimiza¸c˜ao da fun¸c˜ao objetivo definida pela Equa¸c˜ao (4.1) ´e similar ao empregado em deforma¸c˜ao de imagens do tipo “t˜ao-r´ıgido-quanto-poss´ıvel” (Schaefer et al., 2006). Por´em, em oposi¸c˜ao `as aplica¸c˜oes de deforma¸c˜ao de imagem, onde as trans- forma¸c˜oes afins s˜ao de R2 em R2, aqui os mapeamentos afins s˜ao de Rm em R2. Ent˜ao, a formula¸c˜ao usada em deforma¸c˜ao de imagens n˜ao se aplica neste contexto, muito mais generalizado. Logo, uma nova formula¸c˜ao ´e requerida.
A restri¸c˜ao M⊤M = I na Equa¸c˜ao (4.1) implica uma transforma¸c˜ao isom´etrica no mapeamento. Note que:
kMxk2 = (M x)⊤M x = x⊤M⊤M x = x⊤x =kxk2,
logo, a matriz ortogonal M age como uma “isometria” sobre o espa¸co vetorial Rm, evitando efeitos como escala e cisalhamento. Ou seja, os dados podem ser somente rotacionados e/ou transladados durante o mapeamento. Este comportamento ´e ideal para proje¸c˜ao multidimensional, j´a que preserva distˆancias tanto quanto poss´ıvel ao projetar os dados.
Se nenhuma restri¸c˜ao ´e imposta, o m´ınimo da Equa¸c˜ao (4.1) pode ser obtido atrav´es de um procedimento convencional de ajuste por m´ınimos quadrados. No entanto, neste caso, erros no posicionamento dos pontos de controle podem ser propagados pelos mapea- mentos locais afins, resultando em proje¸c˜oes de baixa qualidade. Para uma discuss˜ao mais detalhada sobre ortogonalidade e restri¸c˜oes em problemas de minimiza¸c˜ao, veja Gower e Dijksterhuis (2004).
Al´em disso, na Equa¸c˜ao (4.1) os pesos αi dependem do ponto de avalia¸c˜ao, mas uma transforma¸c˜ao afim distinta ´e obtida para cada instˆancia x, atendendo este pr´e-requisito. Finalmente, em contraste `as aplica¸c˜oes de deforma¸c˜ao de imagem, n˜ao ´e necess´ario garan- tir continuidade para a transforma¸c˜ao toda, pelo contr´ario, descontinuidades podem ser altamente desej´aveis para manter afastadas as instˆancias de dados n˜ao correlacionadas durante a proje¸c˜ao. Esta flexibilidade permite restringir o somat´orio na Equa¸c˜ao (4.1) levando em conta somente os pontos de controle em uma vizinhan¸ca de x, o que torna o processo totalmente local. Na verdade, quanto mais amostras s˜ao consideradas no so- mat´orio, menos local ser´a a proje¸c˜ao de x (Se¸c˜oes 4.2.2 e 4.3 abordam esta quest˜ao).
Fazendo as derivadas parciais com respeito a t iguais a zero, pode-se escrever t em fun¸c˜ao de M : t = ˜y− ˜xM, ˜x = Pk i=1αixi α , ˜y = Pk i=1αiyi α , (4.3)
onde α =Pki=1αi. Assim, o problema de minimiza¸c˜ao da Equa¸c˜ao (4.1) pode ser reescrito como:
k X
i=1
αikˆxiM − ˆyik2, restrito `a M⊤M = I, (4.4) onde ˆxi = xi− ˜x e ˆyi = yi− ˜y.
A Equa¸c˜ao (4.4) pode ser expressa na forma matricial, como segue:
kAM − BkF, restrito `a M⊤M = I, (4.5)
onde k · kF denota a norma de Frobenius, e as matrizes A and B s˜ao dadas por:
A = √α 1ˆx1 √α 2ˆx2 ... √α kˆxk , B = √α 1ˆy1 √α 2ˆy2 ... √α kˆyk . (4.6)
O problema de minimiza¸c˜ao da Equa¸c˜ao (4.5) ´e um t´ıpico exemplo de Problema de Procrustes Ortogonal (Gower e Dijksterhuis, 2004), cuja solu¸c˜ao ´e conhecida:
M = U V , A⊤B = U DV , (4.7)
onde U DV ´e a decomposi¸c˜ao em valores singulares (SVD) de A⊤B. Portanto, encontrado M , a proje¸c˜ao de x ´e dada por:
y = fx(x) = (x− ˜x)M + ˜y. (4.8) A princ´ıpio, pode parecer que o c´alculo de uma decomposi¸c˜ao SVD para cada instˆancia
4.2 Local Affine Multidimensional Projection (LAMP) 81 A⊤B ´e uma matriz m× 2, ou seja, tem somente duas colunas, logo pode ser decomposta muito rapidamente com robustos pacotes SVD (Blackford et al., 2002) (O(k) opera¸c˜oes), resultando em um algoritmo com complexidade computacional igual a O(kn).
O Algoritmo 4.1 descreve os passos necess´arios para computar a transforma¸c˜ao afim, de modo a mapear instˆancias de um espa¸co de alta dimens˜ao para o espa¸co visual. Algoritmo 4.1 Local Affine Multidimensional Projection (LAMP)
Entrada: Conjunto de dados X, pontos de controle XS e mapeamento YS. Sa´ıda: Mapeamento Y .
1: para cada x∈ X fa¸ca
2: Computar os pesos αi. // Equa¸c˜ao (4.2)
3: Computar ˜x e ˜y. // Equa¸c˜ao (4.3)
4: Construir as matrizes A e B. // Equa¸c˜ao (4.6)
5: U DV ← decomposi¸c˜ao SVD de A⊤B.
6: M ← UV .
7: Computar o mapeamento y = (x− ˜x)M+˜y e armazenar em Y . 8: fim para
4.2.2 An´alise dos Pontos de Controle
Existem dois aspectos principais a serem observados quando se lida com os pontos de controle XS. O primeiro aspecto est´a relacionado `a quantidade de pontos de controle. T´ecnicas como a PLMP (Paulovich et al., 2010b), Pekalska (Pekalska et al., 1999), e PLP (Paulovich et al., 2011) tˆem limita¸c˜oes quanto ao n´umero m´ınimo de pontos de controle empregados. PLMP e Pekalska, por exemplo, requerem um n´umero de pontos de controle no m´ınimo igual `a dimens˜ao dos dados, enquanto PLP demanda um n´umero m´ınimo de pontos de controle em cada grafo de vizinhan¸ca local. Na pr´atica, estes m´etodos fazem uso de k = √n pontos de controle para projetar os dados, onde n ´e o n´umero total de instˆancias do conjunto de dados.
A t´ecnica LAMP, entretanto, ´e muito robusta com respeito ao n´umero de pontos de controle, apresentando baixa distor¸c˜ao mesmo quando um n´umero reduzido de pontos de controle ´e usado, como mostrado na Figura 4.2. Note que a fun¸c˜ao de stress (apresentada na Defini¸c˜ao 2.21) n˜ao decai consideravelmente quando o n´umero de pontos de controle aumenta, mostrando que a LAMP pode robustamente mapear instˆancias para o espa¸co visual usando poucos pontos de controle. Um esquema preciso, baseado em for¸ca (Tejada et al., 2003), foi utilizado para posicionar os pontos de controle, selecionados aleatoria- mente, no espa¸co visual. O uso deste esquema n˜ao compromete a eficiˆencia da LAMP, j´a que apenas um n´umero reduzido de pontos de controle precisam ser posicionados.
Figura 4.2: Stress produzido pela LAMP quando o n´umero de pontos de controle varia de 1% a 25% do total de instˆancias do conjunto de dados (ver Tabela 4.1 para detalhes sobre os conjuntos de dados).
Figura 4.3: Stress Ö porcentagem de pontos de controle mais pr´oximos usados para construir os mapeamentos afins, tal que 100% equivale a usar√npontos de controle.
Al´em do n´umero de pontos de controle, o n´umero de termos no somat´orio da Equa¸c˜ao (4.4) pode ser ajustado para modificar o comportamento do mapeamento. Como mencionado na se¸c˜ao anterior, o mapeamento como um todo pode tornar-se descont´ınuo quando o somat´orio n˜ao percorre todos os pontos de controle em XS. No entanto, descon- tinuidades podem ajudar a preservar grupos, bem como melhorar a qualidade da proje¸c˜ao. A Figura 4.3 confirma esta afirma¸c˜ao mostrando que, mesmo quando o n´umero de pontos de controle na vizinhan¸ca de cada instˆancia x ´e pequeno, a medida do stress ainda se mant´em em baixos n´ıveis. O percentual de pontos de controle mais pr´oximos que aparece na Figura 4.3 ´e um parˆametro controlado pelo usu´ario (ver discuss˜ao na Se¸c˜ao 4.5).