• Nenhum resultado encontrado

Na literatura existem v´arios trabalhos propondo a identifica¸c˜ao de diversos tipos de padr˜oes diferentes em trajet´orias ou com uma nova abordagem para descobrir um mesmo padr˜ao.

Um importante trabalho em padr˜oes de trajet´orias foi proposto em (LAUBE; KREVELD; IMFELD, 2005). Este trabalho compara os atri- butos de movimento das trajet´orias (tais quais velocidade e dire¸c˜ao) ao longo do espa¸co e do tempo. S˜ao definidos quatro tipos de padr˜oes que ficaram muito conhecidos: convergˆencia, encontro, flock e lideran¸ca. A convergˆencia trata de trajet´orias movendo para um mesmo local em uma mesma janela de tempo. O encontro ´e caracterizado por um grupo de trajet´orias que se fizeram presentes em uma mesma regi˜ao em um determinado intervalo de tempo. Nele as trajet´orias devem mesmo es- tar na mesma regi˜ao. O flock ocorre quando as trajet´orias se movem juntas (em um c´ırculo de determinado raio), na mesma dire¸c˜ao, durante um tempo especificado. A lideran¸ca deve ter um grupo de trajet´orias seguindo uma outra, a l´ıder.

A partir deste trabalho surgiram v´arios outros com conceitos se- melhantes, como o padr˜ao proposto por (SIQUEIRA; BOGORNY, 2011). Este ´e similar `a lideran¸ca, mas ´e um conceito de persegui¸c˜ao. Ele in- fere que quando uma trajet´oria t1 est´a pr´oxima no tempo e no espa¸co de uma outra trajet´oria t2, mais adiantada e por um certo per´ıodo de tempo, t1 est´a perseguindo t2. Conceitos semelhantes ao flock de (LAUBE; KREVELD; IMFELD, 2005) tamb´em estiveram presentes no mo-

33

ving flock de (WACHOWICZ et al., 2011), que encontra flocks associados ao movimento de pedestres, e no moving cluster (KALNIS; MAMOULIS; BAKIRAS, 2005). Enquanto no moving flock o grupo de trajet´orias que

se move junto ´e o mesmo durante todo o padr˜ao, no moving cluster isso n˜ao ´e necessariamente verdade. A ´unica restri¸c˜ao ´e que o grupo mantenha uma densidade m´ınima.

Esses dois ´ultimos trabalhos encontram trajet´orias que se movem juntas e poderiam ser consideradas como seguindo um caminho padr˜ao, uma vez que sempre tˆem sua vizinhan¸ca com um n´umero m´ınimo de elementos. No entanto, os objetos do flock ou do moving cluster devem estar sincronizados durante todo o movimento, enquanto no trabalho aqui proposto um caminho padr˜ao pode existir sem que o movimento dos objetos seja sincronizado.

Ainda sobre caminhos padr˜ao, tem-se o trabalho de (CHEN; SHEN; ZHOU, 2011). Ele prop˜oe um algoritmo para identificar as rotas mais populares em um conjunto de trajet´orias. Para isso, um grafo ´e cons- tru´ıdo. Os n´os s˜ao o primeiro e ´ultimo ponto de cada trajet´oria junta- mente com todas as interse¸c˜oes de caminhos. As arestas s˜ao os poss´ıveis caminhos de um n´o para outro de acordo com o movimento das tra- jet´orias. Para cada n´o ´e calculada a probabilidade dos caminhos a partir dele, chamada probabilidade de transferˆencia. Ela ´e calculada de acordo com o hist´orico de movimentos a partir do n´o e ´e utilizado o modelo de cadeias absorventes de markov. Dadas essas probabilidades, os caminhos padr˜ao s˜ao encontrados.

Outro trabalho para encontrar rotas populares ´e o de (LI et al., 2007). Essas rotas s˜ao descobertas com base na densidade do tr´afego nas ruas, considerando a ordem sequencial do fluxo dos objetos. J´a em (LEE et al., 2011) as trajet´orias s˜ao mapeadas paras as ruas e depois, de acordo com a frequˆencia de uso delas ´e que s˜ao descobertos os caminhos padr˜ao.

Todos esses trabalhos buscam padr˜oes em trajet´orias, mas n˜ao se preocupam com as trajet´orias fora do padr˜ao. Assim como o movi- mento padr˜ao, seguido pela maioria dos objetos, tamb´em podem haver movimentos com poucas ocorrˆencias, ou at´e mesmo ´unicos. Esse tipo de movimento menos comum ´e chamado de outlier.

Um m´etodo de dete¸c˜ao de outliers foi proposto em (KNORR; NG, 1998). Esse n˜ao ´e um trabalho especificamente de trajet´orias, mas foi desenvolvido para detec¸c˜ao de outliers em bancos de dados, podendo ser aplicado tamb´em para trajet´orias. Ele apresenta a no¸c˜ao de outlier baseado em uma fun¸c˜ao de distˆancia, onde os outliers s˜ao as tuplas distantes da maioria das outras do conjunto de dados. A performance

34

Figura 4 – Exemplo de comportamento avoidance de (ALVARES et al., 2011)

´e analisada de acordo com varia¸c˜oes na composi¸c˜ao dos dados, mas n˜ao h´a nenhuma an´alise posterior dos outliers.

O trabalho de (ALVARES et al., 2011) encontra trajet´orias que desviam de objetos alvo, chamados objetos est´aticos, como cˆameras de seguran¸ca. Como o comportamento esperado ´e cruzar a regi˜ao do objeto, as trajet´orias que desviam dessa regi˜ao s˜ao consideradas outli- ers, mais especificamente, avoidances, caracterizando um movimento suspeito.

Para encontrar o avoidance s˜ao constru´ıdos dois c´ırculos, um maior e um menor em volta de cada objeto alvo, como pode ser visto na figura 4. O c´ırculo menor representa a ´area de cobertura da cˆamera, e o maior representa a regi˜ao de interesse. Objetos que cruzam a regi˜ao menor n˜ao s˜ao considerados outliers, e aqueles que entram na regi˜ao de interesse, mas n˜ao entram na ´area menor s˜ao analisados. Como pode ser visto na figura 4, enquanto a trajet´oria t2n˜ao fez nenhum desvio, t1fez um pequeno desvio pr´oximo ao objeto e t3passou longe, n˜ao chegando nem a entrar na regi˜ao de interesse. Essas considera¸c˜oes s˜ao feitas para avaliar a confian¸ca do padr˜ao, dando mais certeza se foi um desvio intencional ou acidental. Embora haja uma an´alise do avoidance, ele ´e um tipo de outlier entre uma trajet´oria e um objeto est´atico, enquanto o trabalho aqui proposto ´e sobre outliers entre trajet´orias de objetos m´oveis.

Alguns trabalhos foram desenvolvidos especificamente para en- contrar outliers em trajet´orias. Os trabalhos de (LEE; HAN; LI, 2008), de (YUAN et al., 2011) e de (LIU; PI; JIANG, 2013) seguem uma mesma

35

abordagem. Os trˆes particionam as trajet´orias em subtrajet´orias para encontrar os outliers a partir da similaridade entre as subtrajet´orias. Os outliers s˜ao as trajet´orias que tˆem, pelo menos, uma fra¸c˜ao de um determinado comprimento, pouco similar `as outras. A fun¸c˜ao de simi- laridade sempre considera a posi¸c˜ao e a dire¸c˜ao, mas ´e diferente nos trˆes trabalhos. Na figura 5 s˜ao mostrados os passos usados para encontrar os outliers.

Figura 5 – Detec¸c˜ao de outliers por parti¸c˜ao. Adaptado de (LEE; HAN; LI, 2008).

Em (YUAN et al., 2011) a velocidade tamb´em ´e levada em consi- dera¸c˜ao. O trabalho de (LIU; PI; JIANG, 2013) tem uma abordagem de densidade muito parecida com a de (LEE; HAN; LI, 2008), mas que leva em considera¸c˜ao a quantidade de subtrajet´orias em um determinado raio. Em nenhum dos trabalhos o tempo ´e levado em considera¸c˜ao e nenhum aspecto semˆantico ou interpreta¸c˜ao dos resultados ´e realizada. Enquanto esses ´ultimos trˆes trabalhos procuram por trajet´orias com comportamento diferente de todas as outras (ou todas as outras mais pr´oximas) o trabalho de Fontes (FONTES et al., 2013) buscou, antes

de procurar pelos outliers, separar as trajet´orias que v˜ao de uma regi˜ao para outra. Os outliers encontrados s˜ao apenas nesse trecho entre as duas regi˜oes, com o intuito de procurar outliers entre trajet´orias com interesse ou movimento similar, e n˜ao aleatoriamente na base de dados. O segmento, ou a parte das trajet´orias que se move de uma regi˜ao para outra ´e chamada de candidato. O algoritmo verifica a vizinhan¸ca dos pontos de cada candidato. Ela deve satisfazer um n´umero m´ınimo de trajet´orias para que exista um caminho padr˜ao. Os pontos dos candidatos que n˜ao tˆem a vizinhan¸ca m´ınimo s˜ao considerados outliers. Para que toda a subtrajet´oria entre as regi˜oes seja considerada um

36

outlier basta que ela tenha um ponto outlier. Al´em disso, ´e realizada uma an´alise dos outliers, para saber, por exemplo, se o outlier foi mais r´apido do que as trajet´orias no caminho padr˜ao. Apesar de tamb´em analisar o tempo, este trabalho n˜ao busca descobrir a raz˜ao do desvio. Um outro m´etodo ´e proposto em (LI et al., 2009). Os trabalhos detalhados anteriormente consideravam, de uma maneira geral, uma trajet´oria como outlier quando ela tinha um caminho, distˆancia ou ˆ

angulo diferente da maioria, ou seja, caracter´ısticas espaciais. A prin- cipal diferen¸ca para estes outros trabalhos ´e que os outliers em (LI et al., 2009) s˜ao temporais, n˜ao geom´etricos ou espaciais. Para isso ele tem como pr´e-requisito a existˆencia de padr˜oes temporais, ou seja, ele uti- liza informa¸c˜ao temporal de todo o banco de dados para encontrar os outliers. A cada instante a similaridade entre um segmento da estrada, de acordo com os ve´ıculos que passam nela, e os outros segmentos ´e ve- rificada e armazenada em vetores de vizinhan¸ca temporal. Os outliers s˜ao calculados baseado na mudan¸ca desses vetores.

O trabalho proposto em (JANEJA; ATLURI; ADAM, 2004) divide o espa¸co em regi˜oes chamadas unidades atˆomicas geo-espaciais. Um exemplo desse tipo de unidade ´e uma cidade. A partir delas s˜ao gera- das vizinhan¸cas em seu entorno (micro vizinhan¸cas). De acordo com a semelhan¸ca entre essas unidades considerando rela¸c˜oes espaciais e semˆanticas, elas s˜ao seletivamente agrupadas em vizinhan¸cas maiores (macro vizinhan¸cas). Finalmente s˜ao feitas associa¸c˜oes entre as tra- jet´orias e todas as macro vizinhan¸cas. Qualquer associa¸c˜ao forte entre uma macro vizinhan¸ca e uma parte de uma trajet´oria que n˜ao est´a na macro vizinhan¸ca indica uma anomalia ou outlier.

Outros trabalhos mais recentes sobre outliers de uma maneira geral s˜ao (GUPTA et al., 2013) e (AGGARWAL, 2013). O primeiro ´e um survey que apresenta um estudo sobre a detec¸c˜ao de outliers de bancos de dados temporais com defini¸c˜oes, t´ecnicas e diversos tipos de dados temporais. O segundo ´e um livro que traz diferentes pontos de vista sobre outliers. Uma vez que ´e um t´opico bastante explorado por v´arias ´

areas como minera¸c˜ao de dados, aprendizagem de m´aquina, estat´ıstica e banco de dados, o livro busca dar uma vis˜ao mais ampla sobre o tema. Os trabalhos apresentados nesta se¸c˜ao basicamente identificam um comportamento comum em trajet´orias, as que seguem um cami- nho similar ou outliers de trajet´orias. No nosso melhor entendimento, nenhum trabalho vai al´em da descoberta dos padr˜oes.

Um outro t´opico de pesquisa que vem se tornando cada vez mais importante ´e a semˆantica. Como semˆantica entende-se qualquer in- forma¸c˜ao que permita interpretar as trajet´orias ou seus comportamen-

37

tos.

Apesar de haver trabalhos que focam na interpreta¸c˜ao ou adi¸c˜ao de semˆantica aos padr˜oes descobertos, alguns trabalhos tˆem proposto modelos conceituais por exemplo, em (SPACCAPIETRA et al., 2008) e (BOGORNY et al., 2013) e m´etodos para adicionar semˆantica em tra- jet´orias brutas (ALVARES et al., 2011). Em (SPACCAPIETRA et al., 2008) o modelo de stops e moves foi apresentado. Esse modelo define que tra- jet´orias podem ser segmentadas em dois tipos de movimento: os stops e os moves. Basicamente os stops s˜ao as partes em que o objeto m´ovel n˜ao se movimenta e os moves as partes em que o objeto se desloca entre um stop e outro. Geralmente os stops s˜ao mais importantes pois presume-se que se o objeto parou deve haver algum motivo.

No modelo CONSTAnT (BOGORNY et al., 2013) s˜ao definidos os aspectos mais importantes de trajet´orias semˆanticas de uma maneira geral, como por exemplo, o meio de transporte utilizado, o objetivo da trajet´oria e da subtrajet´oria e at´e mesmo informa¸c˜oes sobre o am- biente. Ambos os trabalhos prop˜oem o enriquecimento semˆantico das trajet´orias brutas. No trabalho aqui proposto s˜ao identificados outliers nas trajet´orias e eles ´e que s˜ao interpretados.

No cap´ıtulo seguinte s˜ao apresentados novos conceitos, incluindo uma nova defini¸c˜ao para outlier e um algoritmo para adicionar semˆanti- ca aos outliers.

39

3 DESCOBERTA E INTERPRETAC¸ ˜AO DOS OUTLIERS

O principal objetivo deste trabalho ´e dar significado aos outliers. As raz˜oes para a existˆencia de um outlier s˜ao diversas e podem ser relacionadas a v´arios aspectos.

Ap´os estudos e an´alises sobre quais poderiam ser as raz˜oes que levam um objeto a escolher um caminho diferente da maioria chegou-se aduas situa¸c˜oes:

• devido a existˆencia de algo de interesse do objeto m´ovel fora do caminho mais popular;

• porque o caminho mais popular apresenta alguma caracter´ıstica indesej´avel incentivando o objeto a desviar.

Dessas duas situa¸c˜oes mais gerais chegou-se a trˆes poss´ıveis casos que podem explicar a raz˜ao para o desvio: (a) parada (stop) no desvio, onde o objeto m´ovel teve a inten¸c˜ao de parar em algum lugar fora do caminho padr˜ao, (b) existˆencia de um evento no caminho padr˜ao, que pode ter levado ao desvio e (c) um engarrafamento no caminho padr˜ao no momento do desvio. Esses casos s˜ao chamados de stop outlier, event avoiding outlier e traffic avoiding outlier, respectivamente. Eles s˜ao mutuamente excludentes e foram apresentados na ordem de prioridade. N˜ao se afirma, de maneira nenhuma, que esses sejam os ´unicos casos poss´ıveis. Outra possibilidade de an´alise, mais complexa, seria a escolha de um caminho por preferˆencia pessoal, seja por causa da vista, das condi¸c˜oes da estrada ou qualquer outro motivo. No entanto este trabalho se at´em aos trˆes casos citados.

Para um melhor entendimento dos outliers e de cada possibili- dade considerada para o desvio s˜ao definidos uma s´erie de conceitos necess´arios para a compreens˜ao de cada um dos trˆes casos. Todos eles s˜ao detalhados na pr´oxima se¸c˜ao.

Documentos relacionados