• Nenhum resultado encontrado

Mapas de Mobilidade Pessoal

No documento Mapas de mobilidade pessoal (páginas 92-98)

A criação dos MMP requer a transformação da informação presente na tabela Stays. A partir dela são extraídos os nodos, as arestas e toda a informação que os carateriza.

Os nodos e arestas foram extraídos da tabela com recurso a duas consultas SQL. Em relação aos nodos, agrupando os registos por local foram obtidos todos os atributos necessários para enriquecer os MMP. A maneira como foram obtidos é semelhante à consulta SQL presente na Figura 4.11. Quanto às arestas, em vez de se agrupar por local, cada registo foi agrupado segundo o local origem e o local destino que formam uma trajetória.

Os resultados da consulta dos nodos são semelhantes aos presentes na Tabela 4.5. Isto é, cada local tem uma série de informação que o carateriza. Neste caso, para além dos dois atributos presentes na tabela, estão presentes todos os outros que foram definidos na secção 3.2.5. Os resultados da consulta das arestas difere apenas na existência do local origem e destino.

A informação obtida permitiu a criação de um grafo com um conjunto de nodos e arestas. Este grafo juntamente com a informação caraterizadora

4.7. Mapas de Mobilidade Pessoal

define-se como um MMP. Dois tipos de MMP são então criados: os MMP dos locais visitados e os MMP dos locais relevantes. No primeiro está presente apenas o primeiro filtro. Relativamente aos MMP dos locais relevantes, está presente o primeiro e segundo filtro.

A próxima etapa passa pelo desenho e visualização do MMP. Todo este processo, desde as consultas SQL até à visualização final, poderá ser realizado com recurso à aplicação Gephi6 .

A Gephi é uma plataforma de exploração e visualização interativa para todos os tipos de redes e sistemas complexos, dinâmicos e grafos hierárquicos (Bastian, Heymann, & Jacomy, 2009). Possui uma extensa lista de aplicações de análise exploratória de dados, análise de ligações entre arestas do grafo, análise de redes sociais e biológicas, bem como um conjunto de métricas imple- mentadas como a betweeness, o diâmetro da rede e a modularidade na deteção de comunidades, entre outras.

A plataforma possui integração com vários tipos de base de dados. Isto permitiu a execução de consultas SQL dentro da própria plataforma de modo a obter os nodos e as arestas do grafo e respetiva informação caraterizadora.

Após a execução das consultas com sucesso, define-se o layout do mapa. A escolha depende muito do tipo de grafo que ser quer obter, bem como da dimensão do mesmo (i.e., do número de nodos). Para a visualização dos MMP, com reduzida dimensão, foi utilizado o layout ForceAtlas. No caso dos grafos utilizados na deteção das comunidades, onde estão presentes todos os nodos observados, é utilizado o layout ForceAtlas2. Este último tem a capacidade de lidar com grafos de grandes dimensões apresentando um resultado final de boa qualidade.

Desenhado o grafo, o próximo passo será personalizá-lo de acordo com os atributos desejados. Recorrendo à funcionalidade Ranking da Gephi, é

Capítulo 4. Implementação

possível colorir ou ajustar o tamanho dos nodos de acordo com os valores do atributo escolhido. Quanto às arestas, só é possível colorir.

Para o desenho e visualização dos MMP podiam ter sido utilizadas outras aplicações de visualização de grafos, como a Graphviz7, Tulip8, NetworkX9,

entre muitas outras10. Contudo, a escolha recaiu na Gephi por ser a mais

completa e permite a obtenção de resultados finais com elevada qualidade. Mais completa no sentido de ser possível trabalhar os dados devido à existência de um “laboratório de dados”, bem como guardar o grafo em vários formatos compatíveis com outras aplicações. Quanto aos resultados finais, os layouts de elevada qualidade e precisão obtidos através dos variados algoritmos de layout existentes, o baixo tempo de processamento para obter o grafo final (apesar de depender muito do algoritmo escolhido), bem como a possibilidade de exportar os grafos para formatos de imagem vetoriais com grande qualidade, coloca a Gephi em vantagem em relação às outras aplicações de visualização de grafos.

7Disponível em http://www.graphviz.org/.

8Disponível em http://www.tulip.labri.fr/.

9Disponível em http://networkx.lanl.gov/.

10Lista de várias aplicações para desenho e visualização de grafos disponível em

Capítulo 5

Resultados e Validação

O processo de descoberta, ou inferência, de locais, como o proposto no capí- tulo anterior, é um algoritmo que procura, de forma automática e autónoma (sem qualquer conhecimento prévio da topologia da rede ou intervenção dos utilizadores), inferir informação de contexto dos locais relevantes dos indiví- duos a partir de um conjunto de dados recolhidos. Contudo, este processo não está isento de erros, uma vez que algumas situações inesperadas (como por exemplo a inexistência de redes Wi-Fi) podem levar o algoritmo a apresentar resultados incorretos.

Na descoberta de locais, é importante verificar se todos os passos do pro- cesso, em especial na deteção de comunidades, permitem detetar os locais e respetivas trajetórias realizadas com base somente nos pontos de acesso Wi-Fi. Ao longo deste capítulo descrevem-se os resultados obtidos para um con- junto de voluntários, provando que o algoritmo desenvolvido apresenta uma boa eficácia na descoberta de locais, bem como na deteção dos momentos de entrada e saída de locais.

Capítulo 5. Resultados e Validação

5.1

Recolha de Dados

No capítulo 3 é apresentado todo o algoritmo de descoberta de locais, desde a recolha dos dados até à construção dos MMP. No capítulo seguinte é explicado como esse algoritmo foi implementado. Esta proposta apresentada baseia-se na deteção dos sinais, dos cada vez mais ubíquos APs Wi-Fi, permitindo inferir os locais visitados e respetivas trajetórias.

De modo a obter uma boa fonte de dados, três utilizadores (A, B e C) voluntariaram-se para recolher dados ao longo do seu dia-a-dia. A cada utili- zador foi disponibilizado um smartphone com sistema operativo Android para a recolha de dados, tirando partido dos sensores Wi-Fi embutidos e utilizando uma aplicação própria para o efeito.

Os dados utilizados ao longo deste capítulo foram recolhidos por um pe- ríodo de 91 dias consecutivos. Durante esse tempo, esperava-se que o utiliza- dor não alterasse a sua rotina diária, isto é, que agisse naturalmente como se a aplicação não existisse. Assim, garantia-se uma recolha de dados de mobi- lidade não forçada e representativa dos hábitos de mobilidade do utilizador.

De modo a validar a qualidade dos resultados obtidos pelo algoritmo de- senvolvido com o que realmente acontecia, seria necessário a recolha de ground truth. Cada utilizador tinha como tarefa, manter um diário de todos os lo- cais que visitava por tempo igual ou superior a 5 minutos juntamente com os tempos de entrada e saída (Tabela 5.1). Como não é fácil manter um diário atualizado, só foi possível a obtenção de ground truth de dois utilizadores (A e B) durante um período de 15 dias.

O utilizador A vive no centro de uma grande cidade e trabalha no campus universitário localizado numa outra cidade, de tamanho médio, localizada a 23 km de distância. O utilizador desloca-se de carro entre os dois locais. Os seus movimentos, para além da deslocação entre estes dois locais, foram realizados em redor destes locais. Neste período de recolha o utilizador alterou

5.1. Recolha de Dados

Tabela 5.1: Exemplo da organização de um diário produzido por um utilizador.

Local Entrada Saída

Casa 01-03-2012 18:56 02-03-2012 08:30 LID4 02-03-2012 09:10 02-03-2012 10:05 Bar Engenharia 02-03-2012 10:07 02-03-2012 10:25 LID4 02-03-2012 10:27 02-03-2012 12:45 Cantina 02-03-2012 12:57 02-03-2012 13:35 Bar Engenharia 02-03-2012 13:45 02-03-2012 13:55 LID4 02-03-2012 13:58 02-03-2012 16:45 Bar Engenharia 02-03-2012 16:47 02-03-2012 17:05 LID4 02-03-2012 17:08 02-03-2012 18:25 Casa 02-03-2012 18:55 02-03-2012 19:15 Ginásio 02-03-2012 19:25 02-03-2012 20:45 Casa 02-03-2012 21:55 03-03-2012 08:35

de residência durante uma semana, voltando depois à residência habitual. O utilizador B vive numa cidade de tamanho médio e trabalha no cam- pus universitário situado na mesma cidade. Os seus movimentos são essen- cialmente dentro da cidade, existindo por vezes visitas em trabalho a outra grande cidade.

Sobre os dados em brutos recolhidos pela aplicação, apesar de serem gra- vados para um ficheiro em formato JSON e posteriormente processados de acordo com as transformações descritas nos capítulos anteriores, é importante salientar que todos os registos foram processados pela ordem de recolha, não havendo conhecimento dos registos seguintes. Desta forma, apesar do pro- cesso não estar implementado para funcionar em tempo-real, os resultados obtidos seriam exatamente os mesmos se o processamento tivesse sido feito em tempo-real.

Capítulo 5. Resultados e Validação

Tabela 5.2: Níveis hierárquicos obtidos com uma partição inicial de N nodos e E

arestas (Utilizador A - 91 dias).

Dimensão do Grafo Modularidade Nodos Arestas 1ª Abordagem Nível 0 4382 30334 0.581104 Nível 1 610 1313 0.590774 Nível 2 417 352 0.591056 Nível 3 397 270 0.591059 Nível 4 396 267 0.591059 2ª Abordagem Nível 0 4382 30334 0.532429 Nível 1 561 1016 0.538496 Nível 2 417 354 0.538885 Nível 3 398 277 0.538892 Nível 4 396 269 0.538892

Duração Total 0 segundos

No documento Mapas de mobilidade pessoal (páginas 92-98)

Documentos relacionados