• Nenhum resultado encontrado

RIMENTOS DA TERCEIRA ETAPA 251 E.1 Experimentos com o operador SEQ

Sumário 1 INTRODUÇÃO

RIMENTOS DA TERCEIRA ETAPA 251 E.1 Experimentos com o operador SEQ

E.1.1 Experimentos com dados sintéticos . . . 251 E.1.2 Experimentos com dados reais . . . 253

E.2 Experimentos com o operador CONSEQ . . . 254

E.2.1 Experimentos com dados sintéticos . . . 255 E.2.2 Experimentos com dados reais . . . 257

E.3 Experimentos com o operador ENDSEQ . . . 258

E.3.1 Experimentos com dados sintéticos . . . 258 E.3.2 Experimentos com dados reais . . . 260

E.4 Experimentos com o operador MAXSEQ . . . 261

E.4.1 Experimentos com dados sintéticos . . . 262 E.4.2 Experimentos com dados reais . . . 264

E.5 Experimentos com o operador MINSEQ . . . 266

E.5.1 Experimentos com dados sintéticos . . . 266 E.5.2 Experimentos com dados reais . . . 268

E.6 Experimentos com o operador BESTSEQ . . . 270

E.6.1 Experimentos com dados sintéticos . . . 270 E.6.2 Experimentos com dados reais . . . 274

35

Capítulo

1

Introdução

A partir dos anos 2000, houve um crescente interesse em pesquisas relacionadas a consultas sobre dados em Ćuxo, mais conhecidas como consultas contínuas. Este tipo de consulta é especialmente útil para lidar com dados que ocorrem naturalmente sob a forma de sequência de elementos, como em aplicações relacionadas a bolsa de valores, monitoramento de atletas e telecomunicações. Diversos trabalhos foram propostos para tratar dos problemas relacionados ao processamento de consultas contínuas (CHEN et al., 2000; BABU; WIDOM, 2001; PANDEY; RAMAMRITHAM; CHAKRABARTI, 2003; BABU et al., 2005; JAIN et al., 2008; PETIT; LABBÉ; RONCANCIO, 2012). Com o amadurecimento das pesquisas, começaram a surgir as primeiras linguagens de consulta para dados em Ćuxo (CHANDRASEKARAN et al., 2003; ABADI et al., 2003; KRÄMER, 2007; GEDIK et al., 2008). Dentre as linguagens propostas, a linguagem declarativa Continuous Query Language (CQL) merece destaque por apresentar uma semântica precisa e ser o resultado de diversos trabalhos de pesquisa (BABCOCK et al., 2002; ARASU et al., 2003; ARASU et al., 2004; BABU et al., 2005; ARASU; BABU; WIDOM, 2006; ARASU et al., 2016).

Com o crescente interesse em pesquisas sobre consultas contínuas, vários trabalhos começaram a tratar também da incorporação de preferências no processamento dessas consultas, de forma que os dados retornados atendam às preferências especiĄcadas pelo usuário (SARKAS et al., 2008; AMO; BUENO, 2011; KONTAKI; PAPADOPOULOS; MANOLOPOULOS, 2012; PETIT et al., 2012; LEE; LEE; KIM, 2013). Em geral, as linguagens de consulta baseadas na Structured Query Language (SQL) possuem a cláusula WHERE que impõe restrições duras no processamento da consulta de forma que o resultado deve obrigatoriamente atender a essas restrições. Já as preferências do usuário são tratadas como restrições leves, isto faz com que os itens de dados sejam ordenados de acordo com uma hierarquia de preferência para que aqueles que melhor atendam aos desejos do usuário sejam retornados.

contínuas com preferências, uma interessante questão até então não tratada na literatura cientíĄca dessa área consistia em explorar a informação temporal implícita nos dados em Ćuxo através de consultas contendo preferências temporais. As preferências temporais permitem expressar como os dados em um determinado instante inĆuenciam as preferências em outro momento no tempo.

1.1 Motivação

Desde o Ąnal da década de 1990, tecnologias de monitoramento de dados em Ćuxo passaram a ser usadas nas mais variadas áreas como transporte, segurança pública e esportes. No caso dos esportes, por exemplo, estas tecnologias são especialmente úteis para treinadores de modalidades que envolvem muitos jogadores, como o futebol. Estes proĄssionais podem usar sistemas computacionais capazes de acompanhar os movimentos dos jogadores durante uma partida. O treinador pode especiĄcar preferências temporais em relação ao comportamento dos jogadores e os sistemas computacionais passam a monitorar os dados, em tempo real, para buscar os elementos que melhor atendam às preferências especiĄcadas.

Grande parte dos trabalhos de pesquisa correlatos concentram-se no processamento de consultas skyline (BÖRZSÖNYI; KOSSMANN; STOCKER, 2001; LIN et al., 2005; MORSE; PATEL; GROSKY, 2007; LEE; LEE; KIM, 2013). Neste tipo de consulta, o usuário especiĄca preferências independentes para valores mínimos ou máximos sobre os atributos (CHOMICKI; CIACCIA; MENEGHETTI, 2013). Entretanto, em muitas aplicações o uso de preferências condicionais é mais adequado, permitindo ao usuário exprimir determinadas preferências quando uma certa condição for atendida (RIBEIRO, 2008; AMO; RIBEIRO, 2009; PEREIRA; AMO, 2010). Por exemplo, um treinador de futebol pode ter a seguinte preferência: Şse um jogador é armador, então é melhor que ele Ąque no meio de campo do que na área defensivaŤ. Dentre os trabalhos relacionados ao processamento de consultas contínuas, apenas os trabalhos de Amo e Bueno (2011) e Petit et al. (2012) abordaram a incorporação de preferências condicionais. O trabalho de Amo e Bueno (2011) propôs um algoritmo para processar consultas contínuas contendo preferências condicionais de forma incremental. Entretanto, tal algoritmo não foi implementado e não houveram experimentos para comprovar sua eĄciência. Em Petit et al. (2012), foram introduzidos operadores de preferência na álgebra Astral, originalmente proposta em Petit, Labbé e Roncancio (2010).

Os trabalhos mencionados foram pioneiros no que diz respeito ao processamento de consultas contínuas com preferências condicionais. Contudo, na revisão bibliográĄca realizada considerando o período de 2000 a 2017 nos principais veículos de publicação da área, não foram encontrados trabalhos que tratassem especiĄcamente da incorporação de preferências condicionais temporais em consultas contínuas. O tema de pesquisa

1.1. Motivação 37 que mais se aproxima do trabalho descrito nesta tese é o processamento de consultas contínuas top-k dominantes. Tanto no tema de pesquisa abordado por esta tese quanto nas consultas top-k dominantes, as preferências especiĄcadas nas consultas são usadas para estabelecer uma hierarquia de preferência sobre as tuplas, para que aquelas com maior grau de preferência sejam retornadas. Contudo, nas consultas top-k dominantes, os usuário especiĄcam preferências por valores mínimos ou máximos de atributos, não envolvendo condições ou preferências temporais. Os principais trabalhos sobre este tema são abordados no Capítulo 2.

Com a utilização de preferências condicionais temporais é possível explorar a informação temporal inerente aos Ćuxos de dados durante o processamento das consultas. Considere, por exemplo, um treinador de futebol que tenha acesso a um sistema de informação com dados em tempo real sobre os jogadores durante as partidas. Tal sistema possui o Ćuxo de dados posicionamento (jid, local, bola) com informações sobre o posicionamento dos jogadores. A descrição dos atributos é a seguinte:

jid: identiĄcador do jogador;

local: região do campo de futebol de acordo com as divisões mostradas pela Figura 1(a),

cujas descrições são apresentadas na Figura 1(b);

bola: 1 para indicar que o time possui a bola e 0 em caso negativo.

ad id mc io ao

(a) Divisão em locais

área defensiva ad

intermediária defensiva id

meio de campo mc

intermediária ofensiva io

área ofensiva ao

(b) Descrição dos locais Figura 1 Ű Divisão do campo de futebol em locais

O treinador deseja que os jogadores que estavam posicionados na intermediária defensiva vão para o meio de campo se o time tem a bola. Por outro lado, se o jogador estava na intermediária ofensiva e o time perde a bola, o treinador prefere que os jogadores voltem para o meio de campo para recompor este setor. O Código 1 mostra como as preferências do treinador podem ser incorporadas em uma consulta sobre o Ćuxo posicionamento (maiores detalhes sobre a linguagem usada na consulta são apresentados no Capítulo 6). Observe que as preferências do treinador (na cláusula ACCORDING TO PREFERENCES) têm ŞcondiçõesŤ ligadas a Şmomentos anterioresŤ, portanto são Şpreferências condicionais temporaisŤ. Uma das principais contribuições do trabalho descrito nesta tese é tratar do processamento de consultas contínuas contendo este tipo de preferência.