• Nenhum resultado encontrado

2.2 Algebra Tensorial 20 ´

2.2.6 Rela¸c˜ao entre Modelos de Decomposi¸c˜ao Tensorial

Existem muitos modelos de decomposi¸c˜ao de dados multilineares que podem ser escolhidos ou selecionados para se estudar ou investigar um problema a partir de um conjunto de dados multidimensionais. A maior parte desses modelos surge originalmente dos modelos seminais, PARAFAC e TUCKER. A escolha de um modelo parte primeiro da compreens˜ao clara de suas caracter´ısticas em termos de diferen¸cas e semelhan¸cas com os demais, sendo, portanto, necess´ario conhe- cer e compreender a hierarquia entre eles por se tratar de um procedimento de fundamental importˆancia.

Neste contexto, uma quest˜ao importante ´e como o PARAFAC e os modelos Tucker est˜ao relacionados. Segundo [52], o PARAFAC fornece eixos ´unicos, enquanto os modelos Tucker3 n˜ao, sendo este ´ultimo um modelo que pode ser transformado (rotacionado) e simplificado para parecer mais com um modelo PARAFAC. Esse procedimento, em muitos casos, pode ser feito com pouca ou nenhuma perda de ajuste ou ru´ıdo. Outro elemento claro e de destaque ´e a presen¸ca da hierarquia, como, por exemplo, dentro do pr´oprio modelo de Tucker (Tucker2, Tucker3 e Tuc- ker1). O PARAFAC pode ser dif´ıcil ou imposs´ıvel para determinado conjunto de dados devido a situa¸c˜oes de degenerescˆencias [23], [52] e [46], caso em que um modelo Tucker3 ´e normalmente a melhor escolha, embora aumente consideravel- mente a complexidade da sua an´alise, al´em do que se deve levar em considera¸c˜ao parˆametros estat´ısticos, tais como ru´ıdo e erros de sistem´atica antes da escolha do modelo. Nesse sentido, um modelo multidimensional adequado nem sempre ´e f´acil de ser obtido e sua escolha pode ser alcan¸cada ap´os diversos testes de ade- qua¸c˜ao do modelo que levem em considera¸c˜ao precis˜ao, convergˆencia e velocidade do algoritmo.

2.2.6.1 Rela¸c˜ao entre o Modelo PARAFAC e Tucker3

Iremos considerar novamente que o modelo PARAFAC para R componentes de um ordenamento tridimensional X(I × J × K ) ´e dada por

xijk= R X

r=1

airbjrckr+ eijk (2.21)

na qual xijk, air, bjr, ckr(i = 1, . . . , I; j = 1, . . . , J; k = 1, . . . , K) e eijk s˜ao, respectivamente, os elementos t´ıpicos de X, A(I × R), B(J × R), C(K × R) e E(I × J × K ).

Considerando agora o termo gpqr no sinal de somat´orio com sendo gpqr = 1, se e somente se p = q = r, e 0, caso contr´ario, (2.21) pode ser reescrita como

xijk= P X p=1 Q X q=1 R X r=1 aipbjqckrgpqr + eijk (2.22) com P = Q = R, em que todos os elementos t´ıpicos s˜ao definidos como anterior- mente. A equa¸c˜ao (2.22) ´e similar ao modelo Tucker3 de X. Desse modo, o modelo PARAFAC pode ser compreendido como um modelo restrito Tucker3, conforme ilustrado na Figura 2.13. Portanto, existe uma rela¸c˜ao hier´arquica entre o modelo PARAFAC e o modelo Tucker3. Esse fato tem implica¸c˜oes para o ajuste do modelo PARAFAC e do modelo Tucker3. Um modelo PARAFAC com R componentes se ajusta pior ou igual a um modelo Tucker3 (R, R, R). No entanto, de acordo com [23] e [52], isso n˜ao significa necessariamente que o modelo Tucker3 (R, R, R) seja o preferido, pois h´a mais a se considerar do que simplesmente o seu ajuste.

2.2.6.2 Rela¸c˜ao entre os Modelos Tucker

Tomemos mais uma vez um ordenamento tridimensional de dados X(I × J × K ) e vamos considerar os diversos modelos de Tucker para esse ordenamento. Um modelo Tucker3 para tal ordenamento ´e

xijk= P X p=1 Q X q=1 R X r=1 aipbjqckrgpqr + eijk (2.23)

na qual xijk, aip, bjq, ckr, gpqr e eijk s˜ao os elementos t´ıpicos de X, A(I × P ), B(J × Q), C(K × R), G(P × Q × R) e E(I × J × K ), respectivamente. As ma- trizes A, B e C s˜ao matrizes de carga, G ´e o tensor-n´ucleo e E ´e o tensor de res´ıduos ou de ru´ıdo da informa¸c˜ao.

Podemos obter um modelo Tucker2 a partir de um modelo Tucker3, definindo o n´umero de componentes em um modo para a dimens˜ao desse modo. ´E poss´ıvel definir o n´umero de componentes no modo trˆes para K e o modelo Tucker3 pode ser dado por

xijk= P X p=1 Q X q=1 R X r=1 aipbjqckrgpqr + eijk (2.24)

De acordo com [23], [52], a liberdade de rota¸c˜ao do modelo Tucker3 permite que a matriz de carga C(K × K ) possa ser rotacionada para a matriz identidade I(K × K ). Ent˜ao ckr ´e um elemento para k = r e zero nas duas demais posi¸c˜oes. Reescrevendo (2.24), usando os mesmos s´ımbolos para a forma¸c˜ao rotacionada para simplificar, tem-se que

xijk = P X p=1 Q X q=1 R X r=1 aipbjqckkgpqk+ eijk= P X p=1 Q X q=1 aipbjqfpqk+ eijk (2.25) na qual o termo fpqk ´e definido implicitamente. Na forma de nota¸c˜ao matricial, temos que:

X(K ×IJ ) = CG(K ×PQ)(B ⊗ A)t+ E

= F(K ×PQ)(B ⊗ A)t+ E (2.26)

na qual F(K ×PQ) = CG(K ×PQ) = IG(K ×PQ), e ambos tensores F e G s˜ao de dimens˜oes P × Q × K . N˜ao h´a cargas no modo trˆes, como tamb´em o modo trˆes n˜ao ´e comprimido. Novamente, A e B s˜ao matrizes de carga e E ´e o ordenamento tridimensional de res´ıduos, contudo esses s˜ao diferentes do correspondente modelo

Tucker3. O ordenamento tridimensional F ´e chamado tensor-n´ucleo estendido no modelo Tucker2. Existem dois tipos adicionais de modelos Tucker2, ou seja, um em que o primeiro modo n˜ao ´e comprimido e um em que o segundo modo n˜ao ´e comprimido.

A compreens˜ao da hierarquia de modelos Tucker3 e Tucker2 parte do pressuposto que assumimos um modelo Tucker3 X = AG(C⊗B)t+E e, em seguida, um modelo semelhante Tucker2 em que o modo um n˜ao ´e reduzido X = F(C ⊗ B)t+ E, no qual F ´e o tensor n´ucleo Tucker2. Os parˆametros em B e C s˜ao diferentes entre os dois modelos, mas o importante que temos de observar aqui ´e que o modelo Tucker2 ser´a mais flex´ıvel do que o modelo Tucker3, visto que no Tucker3 a parte correspondente a F ´e especificamente parametrizada como AG. Conforme afirma [52], o modelo Tucker2 vai se ajustar melhor do que o modelo Tucker3 e o modelo Tucker3 pode ser visto como um modelo Tucker2 limitado, em grande parte da mesma forma que os modelos lineares.

O modelo Tucker2 pode at´e ser menos restritivo, por exemplo, por n˜ao comprimir o modo dois. Isso pode ser feito atrav´es da formula¸c˜ao do modelo Tucker1 que est´a representado em (2.27). Assim,

xijk = P X p=1

aiphpjk+ eijk (2.27)

no qual xijk, aip e eijk s˜ao os elementos de X, A(I × P ) e E(I × J × K ), respecti- vamente. Os valores de hpjk s˜ao os elementos do ordenamento H(P × J × K ). O modo dois e trˆes de X n˜ao s˜ao comprimidos, porque as cargas n˜ao s˜ao previstas nesses modos. Esse modelo ´e muito menos restrito do que o modelo Tucker2 e, portanto, se ajusta melhor.

De forma conclusiva temos que, um modelo Tucker3 compacta todos os trˆes modos, enquanto um modelo Tucker2 comprime apenas dois dos trˆes modos e, por fim, um modelo Tucker1 comprime apenas um dos trˆes modos [72].