• Nenhum resultado encontrado

Descritor baseado na Lei de Coulomb

No documento AO DE REGRAS DE ASSOCIAC (páginas 35-41)

3.2 S´eries unidimensionais

3.2.1 Descritor baseado na Lei de Coulomb

A Lei de Coulomb estabelece a relac¸˜ao matem´atica entre a carga de dois ou mais corpos e sua forc¸a el´etrica produzida, calculando as forc¸as de interac¸˜ao (atrac¸˜ao e repuls˜ao) existentes nessas cargas. Os princ´ıpios da lei de Coulomb podem ser expressos por:

• A intensidade da forc¸a el´etrica ´e diretamente proporcional ao produto das cargas el´etricas; e

3.2 S´eries unidimensionais 33 Tabela 3.1: Comparativo entre os descritores encontrados na literatura

Descritor Vantagens Desvantagens

Sequential Scan apresenta boa

acur ´acia

tem elevado custo computacional

Transformada Discreta de Fourier

eficiente para an ´alise de s ´eries com grande variac¸ ˜ao entre os da- dos

ruim para an ´alise de s ´eries estacion ´arias

Decomposic¸ ˜ao em valores singulares n ˜ao apresenta grande perda da representatividade da s ´erie apresenta perda na representac¸ ˜ao de grandes sub-

sequ ˆencias e tem alto custo computaci- onal

Transformada discreta de wavelet

n ˜ao h ´a ineficiente para

s ´eries com grandes amplitudes

Piecewise aggregate ap- proximation - PAA custo computacional m ´edio apresenta perdas graves na repre- sentatividade de s ´eries com grandes variabilidade dos dados

Adaptive Piecewise Cons- tant Approximation - APCA

resultados melhores que o descritor PAA

custo computacional alto para s ´eries com grande variabilidade dos dados

Piecewise Linear Aproxi- mation - PLA

apresenta resultados satisfat ´orios para s ´eries estacion ´arias

baixa acur ´acia para s ´eries com variabili- dade nos dados Symbolic Aggregate Ap-

proximation - SAX

baixo custo computa- cional

perda de representa- tividade da s ´erie Dynamic time warping -

DTW

boa acur ´acia custo computacional quadr ´atico

• A intensidade da forc¸a el´etrica ´e inversamente proporcional ao quadrado da distˆancia entre os corpos.

A f´ormula da lei ´e expressa em 3.1 :

~

F = Kq1q2

r2 ˆr (3.1)

3.2 S´eries unidimensionais 34

~

F ´e a forc¸a em Newtons;

r ´e a distˆancia entre as duas cargas pontuais;

q1 e q2s˜ao as intensidades das cargas; ˆr ´e o vetor unit´ario de direc¸˜ao; e

K ´e a constante de Coulomb.

Diante do exposto, a proposta para busca de similaridade em s´eries, considera as observac¸˜oes da s´erie temporal como cargas puntiformes com valores de carga q constantes localizadas no plano de coordenadas formadas pelo ´ındice da s´erie e pelo valor da observac¸˜ao.

Como ´e necess´ario o c´alculo da distˆancia existente entre as cargas para obter a interac¸˜ao en- tre elas, considera-se um plano cartesiano formado pelo ´ındice da s´erie temporal (eixo das abs- cissas) e pelo valor das observac¸˜oes (eixo das ordenadas) e assim ´e poss´ıvel calcular a distˆancia entre as cargas para o c´alculo das forc¸as.

Al´em disso, uma carga fict´ıcia puntiforme q ´e inserida no centroide composto pelos con- juntos das observac¸˜oes que comp˜oem as subsequˆencias de busca e essa carga tem por objetivo proporcionar a representac¸˜ao do intervalo, pois, al´em de se localizar no centro geom´etrico da subsequˆencia, ela ´e utilizada para o c´alculo da interac¸˜ao entre ela e as demais cargas gerando a forc¸a resultante que representa a subsequˆencia.

Como a forc¸a resultante ´e uma medida vetorial, logo, a direc¸˜ao e sentido da carga influ- enciam o c´alculo, para isso, foi estabelecido que cargas que se encontram abaixo da carga existente no centroide, possuem direc¸˜ao contr´aria `aquelas que se encontram acima dela e, por consequˆencia, apresentam intensidade negativa de forc¸a.

Dessa forma, ´e poss´ıvel representar a s´erie temporal por meio de um sistema de interac¸˜ao de part´ıculas eletricamente carregadas e calcular a forc¸a resultante F, obtida por meio de uma soma vetorial de todas as forc¸as que integram o sistema e assim conseguir reduzir a dimensionalidade da s´erie para auxiliar a busca por similaridade sem grande perda de informac¸˜ao.

O descritor Coulomb ´e formalmente definido a seguir. Seja uma s´erie temporal unidimensi- onal Y = (x1, x2..., xn). Para um intervalo de interesse P[i, j] | 1 ≤ i ≤ j ≤ n, tem-se a subsequˆencia

Sp= (xi, xi+1..., xj) correspondente ao intervalo.

O centroide de Sp ´e dado por Cp= (Pp, Hp), onde Pp ´e o centro do ´ındice das observac¸˜oes

3.2 S´eries unidimensionais 35

Pp=

j − i

2 (3.2)

e, Hp ´e a altura m´edia da subsequˆencia Sp e ´e dada pela m´edia das medidas de Sp, dada

por: Hp= Pj b=ixb | Sp| , (3.3)

onde | Sp| ´e o n´umero de observac¸˜oes da subsequˆencia Sp.

O m´odulo da distˆancia de uma observac¸˜ao Qp∈ Spat´e o centroide ´e dado por:

r = v t n X k=1 (|Cp− Qp|)2 (3.4)

E a direc¸˜ao vetorial ˆr ´e dada por: ˆr = ~Cp+ ~Qp

A carga puntiforme q(sp) em Sp ´e dada por q(xb) = −q, se xb< Hp; 0 se xb= Hp; +q se

xb> Hpe a carga puntiforme em q(cp) = q.

A forc¸a resultante ~Fdas cargas de Spsobre a carga colocada em Cp ´e dada por:

~ F = j X a=i q(cp).q(sa) r2 ˆr, (3.5)

Assim, a subsequˆencia Sp ´e representada por Sp→< ~Fp, Hp>.

Nesta abordagem proposta, o vetor de caracter´ısticas ´e formado pela forc¸a resultante cal- culada na subsequˆencia de interesse e, tamb´em, pela altura do centroide. Conforme exibido na Express˜ao 3.6:

V = [ ~F, H] (3.6)

A necessidade do uso da altura do centroide se justifica, pois a forc¸a resultante consegue mapear a interac¸˜ao entre os pontos do intervalo que a comp˜oe, no entanto, nenhuma informac¸˜ao com relac¸˜ao `a altura existente entre os dados originais ´e armazenada e essa informac¸˜ao ´e im- portante para o c´alculo da similaridade.

Para definir o grau de semelhanc¸a entre as instˆancias, utilizando o vetor de caracter´ısticas anteriormente descrito, ´e aplicada a distˆancia Euclidiana. O uso desta distˆancia se justifica, pois

3.2 S´eries unidimensionais 36

ela se aplica melhor aos dados e `a f´ormula da Lei de Coulomb, mantendo a intensidade da forc¸a el´etrica inversamente proporcional ao quadrado da distˆancia entre os corpos.

Na Figura 3.1 ´e ilustrada a representac¸˜ao gr´afica de uma subsequˆencia da s´erie com a inserc¸˜ao de cargas puntiformes nos valores das observac¸˜oes e de uma carga neutra inserida no centroide do intervalo e na Figura 3.2 ilustra-se a convenc¸˜ao da intensidade das cargas ado- tadas. A Figura 3.3 mostra a interac¸˜ao entre a carga inserida no centroide e as demais cargas existentes no intervalo.

Figura 3.1: Representac¸˜ao de uma subsequˆencia da s´erie formada por 7 observac¸˜oes com suas respectivas cargas puntiformes inseridas nas observac¸˜oes e uma carga neutra inserida no centroide.

3.2 S´eries unidimensionais 37

Figura 3.3: Interac¸˜ao entre as cargas da s´erie e a carga inserida no centroide.

Na Figura 3.4 ´e exibido o algoritmo principal do descritor Coulomb e na figura 3.5 uma func¸˜ao auxiliar para o c´alculo da forc¸a.

O algoritmo do descritor Coulomb recebe como entrada uma s´erie temporal e uma sub- sequˆencia de interesse definida pelo usu´ario e retorna as subsequˆencias ordenadas pelo grau de similaridade fazendo uma consulta do tipo knn com k igual `a quantidade de intervalos que cabem na s´erie sem repetic¸˜ao.

Na linha 1 o algoritmo inicia a leitura dos dados procurando por subsequˆencias relevantes, ou seja, prov´aveis candidatos similares ao objeto de interesse por meio da an´alise de pontos cres- centes ou decrescentes. Nas linhas 2, 3 e 4, o algoritmo calcula a forc¸a resultante de interac¸˜ao entre as cargas por meio do algoritmo auxiliar exibido na Figura 3.5. Ap´os isso, h´a a ordenac¸˜ao do vetor que cont´em os valores da forc¸a resultante de acordo com a similaridade entre esses intervalos e o intervalo de interesse (linhas 5, 6 e 7) e o resultado ´e exibido para o usu´ario na

linha 8.

O algoritmo auxiliar para o c´alculo da forc¸a recebe como entrada uma subsequˆencia da s´erie e retorna um vetor com a forc¸a resultante e a altura do centroide. Na linha 1, o algoritmo calcula o centroide do intervalo. E para cada ponto pertencente `a subsequˆencia ´e calculada a interac¸˜ao entre esse ponto e o centroide pela Lei de Coulomb (linhas 2 e 3). A forc¸a resultante ´e obtida pela soma das forc¸as calculadas em cada ponto e o resultado ´e retornado para o algoritmo principal (linhas 4 e 5).

3.2 S´eries unidimensionais 38

Algoritmo: Coulomb Entrada:

• Uma s´erie temporal Y na forma (x1, x2, ..., xn);

• Uma subsequˆencia de interesse

Sa´ıda: subsequˆencias da s´erie ordenadas pelo grau de similaridade. 1. percorra a base de dados

2. para cada intervalo relevante da s´erie fac¸a 3. vetor[][] = Calcule ~F(intervalo)

4. x[][] = Calcule ~F(interesse)

5. ordene vetor[] de acordo com a proximidade com x 6. para cada valor ~F de vetor fac¸a

7. result[][] = [F, altura] 8. escreva result

Figura 3.4: Algoritmo para c´alculo da forc¸a resultante F.

Algoritmo: C´alculo de ~F

Entrada:

• Subsequˆencia da s´erie Y na forma (x1, x2, ..., xn);

Sa´ıda: Forc¸a resultante [F, h].

1. C = centroide(F)

2. para cada ponto do intervalo da s´erie Y fac¸a

3. f orca = Coulomb(C, P)

4. F=Pan a1 f orca

5. retorne [F, altura(C)]

Figura 3.5: Algoritmo auxiliar para c´alculo da forc¸a resultante.

No documento AO DE REGRAS DE ASSOCIAC (páginas 35-41)

Documentos relacionados