• Nenhum resultado encontrado

Associando Dados sobre Movimento Textualmente Anotados a Dados Ligados Abertos

N/A
N/A
Protected

Academic year: 2021

Share "Associando Dados sobre Movimento Textualmente Anotados a Dados Ligados Abertos"

Copied!
58
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DE SANTA CATARINA DEPARTAMENTO DE INFORM ´ATICA E ESTAT´ISTICA

Cleto May

ASSOCIANDO DADOS SOBRE MOVIMENTO TEXTUALMENTE ANOTADOS A DADOS LIGADOS ABERTOS

Florian´opolis 2014

(2)
(3)

Cleto May

ASSOCIANDO DADOS SOBRE MOVIMENTO TEXTUALMENTE ANOTADOS A DADOS LIGADOS ABERTOS

Trabalho de Conclus˜ao de Curso subme-tido ao curso de Sistemas de Informac¸˜ao para a obtenc¸˜ao do Grau de Bacharel.

Florian´opolis 2014

(4)
(5)

Dedico este trabalho ao meu pai Irmelindo May, minha m˜ae Juc´elia da Silva May e mi-nha irm˜a Clarissa May.

(6)
(7)

AGRADECIMENTOS A minha fam´ılia cujo amor ´e incondicional.

A meus amigos com quem pude e certamente poderei trocar boas ri-sadas.

A Universidade Federal de Santa Catarina, especialmente aos profes-sores, por mudarem para melhor a minha forma de ver o universo.

A todos que direta ou indiretamente fizeram parte da minha formac¸˜ao, o meu muito obrigado.

(8)
(9)

RESUMO

O progresso recente na an´alise de dados sobre movimento considera prin-cipalmente dados espac¸o-temporais (e.g. trajet´orias). Contudo, outras informac¸˜oes (e.g., tags e coment´arios associados a dados espac¸o-temporais) tamb´em poderiam ajudar a explicar movimentos (e.g., identificar classes de locais e eventos frequentados). Este trabalho introduz um m´etodo para enri-quecer semanticamente dados sobre movimento textualmente anotados (e.g., trajet´orias com trechos anotados, sequˆencias de postagens de usu´arios em m´ıdias sociais) associando-os a dados ligados abertos. A vers˜ao atual do nosso m´etodo usa proximidade espacial e textual para encontrar e ranquear poss´ıveis associac¸˜oes. Dados reais do Flickr, LinkedGeoData e DBPedia est˜ao sendo usados para testar um prot´otipo implementado do m´etodo pro-posto.

Palavras-chave: Dados sobre movimento. Dados ligados abertos. Enrique-cimento semˆantico.

(10)
(11)

ABSTRACT

The recent progress in movement data analysis mostly considers spatiotem-poral data (e.g. trajectories). However, other information (e.g., tags and com-ments associated to the spatiotemporal data) could also help to better un-derstand movements (e.g., indentify classes of frequented places and events). This work introduces a method for semantic enriching textually annotated movement data (e.g., trajectories with some annotated segments, sequences of users’ posts in social media) by associating them to Linked Open Data. The current version of our method uses spatial and textual proximity to find and rank possible associations. Real data from Flickr, LinkedGeoData and DBPedia have been used to test a prototype that implements the proposed method.

(12)
(13)

LISTA DE FIGURAS

Figura 1 Trecho da ontologia do LinkedGeoData . . . 26

Figura 2 Trecho da p´agina web ilustrando as propriedades de um re-curso da ontologia do LinkedGeoData . . . 26

Figura 3 Arquivo RDF adaptado do LinkedGeoData . . . 28

Figura 4 Exemplo real da ligac¸˜ao existente entre duas ontologias distin-tas (LinkedGeoData e DBPedia) . . . 29

Figura 5 Consulta SPARQL que recupera recursos que sejam do tipo (rdf:type) lgdo:BicycleShop . . . 29

Figura 6 Consulta SPARQL que recupera recursos a pelo menos 100 metros de distˆancia da coordenada (-48.55021, -27.586136) . . . 30

Figura 7 Trajet´orias, adaptado de (NABO et al., 2014) . . . 31

Figura 8 Trilhas, adaptado de (NABO et al., 2014) . . . 31

Figura 9 Sequˆencia de dados sobre movimento . . . 32

Figura 10 Sequˆencia semˆantica de dados sobre movimento . . . 33

Figura 11 Exemplo de aplicac¸˜ao da func¸˜ao Levenshtein cujo resultado s˜ao sete operac¸˜oes de edic¸˜ao . . . 34

Figura 12 Fluxo das principais etapas do algoritmo . . . 39

Figura 13 Filtro espacial . . . 41

Figura 14 Exemplo de associac¸˜ao em ´area densa . . . 43

Figura 15 Distribuic¸˜ao das postagens do Flickr na geometria do Brasil . . 45

Figura 16 Distribuic¸˜ao de similaridade l´exica (recursos a 1024 metros de distˆancia) . . . 47

Figura 17 Distribuic¸˜ao de similaridade l´exica (recursos a 1024 metros de distˆancia) . . . 48

Figura 18 Vis˜ao geogr´afica dos experimentos . . . 50

Figura 19 Exemplo de enriquecimento semˆantico, adaptado de (ALVA-RES et al., 2007) . . . 51

(14)
(15)

LISTA DE TABELAS

Tabela 1 Tabela de prefixos . . . 27

Tabela 2 Exemplo de comparac¸˜ao entre ocorrˆencias de palavras utili-zando Modelo Booleano . . . 36

Tabela 3 Exemplo de verificac¸˜ao da ocorrˆencias de palavras similares para τs= 0, 8 . . . 37

Tabela 4 Proximidade textual . . . 42

Tabela 5 Tagsfrequentemente utilizadas . . . 46

Tabela 6 Vis˜ao textual dos experimentos . . . 49

(16)
(17)

LISTA DE ABREVIATURAS E SIGLAS

LOD Linked Open Data . . . 21

URI Uniform Resource Indetifier . . . 25

HTML HyperText Markup Language . . . 25

RDF Resource Description Framework . . . 27

XML Extensible Markup Language . . . 27

W3C World Wide Web Consortium . . . 27

SQL Strutured Query Language . . . 29

(18)
(19)

LISTA DE S´IMBOLOS

rd f Tripla RDF . . . 27

u URI de um recurso . . . 27

pr Propriedade . . . 27

v Valor . . . 27

MD Sequˆencia de dados sobre movimento . . . 31

(x, y) Coordenada geogr´afica . . . 31

t Instante de tempo . . . 31

S Colec¸˜ao de palavras . . . 31

s Palavra . . . 31

SMD Sequˆencia semˆantica de dados sobre movimento . . . 32

A Colec¸˜ao de anotac¸˜oes semˆanticas . . . 32

a Anotac¸˜ao semˆantica . . . 32

c S´ımbolo . . . 33

l Tamanho de uma palavra . . . 33

(20)
(21)

SUM ´ARIO 1 INTRODUC¸ ˜AO . . . 21 1.1 OBJETIVO GERAL . . . 22 1.2 OBJETIVOS ESPEC´IFICOS . . . 23 1.3 METODOLOGIA . . . 23 1.4 ORGANIZAC¸ ˜AO DO TRABALHO . . . 24 2 FUNDAMENTOS . . . 25

2.1 DADOS LIGADOS ABERTOS . . . 25

2.2 DADOS SOBRE MOVIMENTO . . . 30

2.3 FUNC¸ ˜OES DE COMPARAC¸ ˜AO TEXTUAL . . . 33

3 M ´ETODO PROPOSTO . . . 39

4 EXPERIMENTOS . . . 45

4.1 RESULTADOS . . . 47

4.2 DISCUSS ˜AO . . . 48

5 TRABALHOS RELACIONADOS . . . 51

6 CONCLUS ˜AO E TRABALHOS FUTUROS . . . 53

(22)
(23)

21

1 INTRODUC¸ ˜AO

A ´ultima d´ecada contou com grande popularizac¸˜ao de dispositivos m´oveis (e.g., smartphones) e outros equipamentos dotados de sensores (e.g., GPS, GSM, RFID, cˆameras) capazes de registrar movimento. Diversas aplicac¸˜oes podem se beneficiar pela enorme quantidade de dados coletados usando tais tecnologias, por exemplo, aquelas que planejam roteiros tur´ısticos ou aquelas que auxiliam o planejamento urbano. Todavia, isso requer t´ecnicas apropriadas para extrair informac¸˜oes desses dados.

Dados sobre movimento s˜ao sequˆencias temporalmente ordenadas de posic¸˜oes no espac¸o ocupadas por objetos que se movem. Cada amostra de posic¸˜ao de um objeto m´ovel inclui coordenadas geogr´aficas, o momento em que o objeto ocupa tal posic¸˜ao e possivelmente anotac¸˜oes associadas (e.g., tags, coment´arios). Este trabalho utiliza o termo “dados sobre mo-vimento”como uma generalizac¸˜ao para trajet´orias (PARENT et al., 2013) e trilhas (NABO et al., 2014) de usu´arios de m´ıdias sociais (e.g., Twitter, Face-book, FourSquare, Flickr, Instagram). Uma trajet´oria ´e uma sequˆencia tem-poralmente ordenada de posic¸˜oes de um objeto m´ovel colhidas por sensores e aplicativos espec´ıficos para tal finalidade. Uma trilha de usu´ario em m´ıdia social ´e uma sequˆencia temporalmente ordenada de postagens deste usu´ario em tal m´ıdia. A representac¸˜ao de cada postagem inclui posic¸˜ao geogr´afica e momento da postagem, al´em do seu conte´udo. Trajet´orias costumam ter boa precis˜ao espac¸o-temporal, devido `a coleta de amostras de posic¸˜ao usual-mente feita a intervalos curtos e regulares (e.g., cada segundo, cada 3 metros). Trilhas de redes sociais, por outro lado, costumam ser esparsas, devido a ca-racter´ıstica ass´ıncrona das postagens dos usu´arios em redes sociais.

´

E dif´ıcil conseguir grandes colec¸˜oes de trajet´orias anotadas, pois a anotac¸˜ao ´e um processo laborioso. Por outro lado, trilhas de redes soci-ais costumam ser ricas em informac¸˜oes textusoci-ais. O m´etodo de enriqueci-mento semˆantico proposto ´e desenvolvido e implementado para funcionar com v´arios tipos de dados sobre movimento textualmente anotados, incluindo trajet´orias, trilhas de m´ıdias sociais e dados sobre movimento obtidos medi-ante fus˜ao espac¸o-temporal de trajet´orias com trilhas (NABO et al., 2014).

O desenvolvimento de sistemas que consigam capturar diversos aspec-tos semˆanticos do movimento (e.g., locais visitados, raz˜oes de movimenaspec-tos e paradas) ainda ´e um desafio, mesmo quando a entrada de tais sistemas inclui dados anotados textualmente. Este trabalho visa contribuir com estre pro-blema, propondo t´ecnica para associar dados sobre movimento textualmente anotados a recursos de colec¸˜oes de dados ligados abertos (LOD) dispon´ıveis na Web Semˆantica, auxiliando na an´alise do movimento segundo diversos

(24)

as-22

pectos semˆanticos. (FILETO et al., 2013) mostra os benef´ıcios da utilizac¸˜ao de grandes colec¸˜oes de LOD atualmente dispon´ıveis, aderentes a padr˜oes e com semˆantica bem definida, na an´alise de dados sobre movimento. Por´em, (FILETO et al., 2013) n˜ao resolve adequadamente o processo de enriqueci-mento semˆantico de dados sobre movienriqueci-mento utilizando LOD.

O trabalho aqui descrito ´e um dos primeiros passos no sentido de es-tudar o processo de associac¸˜ao, isto ´e, associar dados sobre movimento e recursos de LOD. A vers˜ao atual do m´etodo que realiza a associac¸˜ao pro-posta baseia-se em proximidade espac¸o-temporal e textual. Para cada posic¸˜ao do movimento (que pode se referir a uma parada, por exemplo) filtramos os recursos de LOD dentro de um certo raio de abrangˆencia espacial. Ent˜ao utilizamos proximidade textual via SoftTFIDF (COHEN; RAVIKUMAR; FI-ENBERG, 2003) entre sequˆencias de caracteres associadas a posic¸˜oes ocupa-das por objetos m´oveis e sequˆencias de caracteres associaocupa-das a cada recurso de LOD no raio de abrangˆencia para obter as associac¸˜oes. Ajustes de certos parˆametros do m´etodo proposto podem permitir obter bons resultados para diferentes colec¸˜oes de dados sobre movimento e dados ligados abertos (i.e., parˆametro espacial maior para trilhas de m´ıdias sociais, parˆametro textual mais flex´ıvel para anotac¸˜oes livres de usu´ario).

Este m´etodo foi implementado em um prot´otipo utilizando linguagem Java. Tal prot´otipo roda sobre base de dados PostgreSQL com a extens˜ao espacial PostGIS para indexac¸˜ao e busca eficiente dos recursos espaciais, via GIST. Experimentos tˆem sido realizados com v´arias colec¸˜oes de dados sobre movimento (e.g., trilhas do Flickr e do Twitter) e LOD obtidos de diversas fontes (e.g., DBPedia1, LinkedGeoData2, LinkMapia (SACENTI; FILETO, 2014)). Partimos do princ´ıpio que se o m´etodo funciona para trilhas de m´ıdias sociais que s˜ao esparsas, o m´etodo n˜ao encontrara dificuldades quando apli-cado a trajet´orias. Inicialmente avalia-se tempos de execuc¸˜ao e quantidades de associac¸˜oes obtidas, enquanto em trabalhos futuros planeja-se executar outros experimentos de coleta e anotac¸˜ao de dados sobre movimento com vo-lunt´arios para obter dados sobre movimento manualmente associados a recur-sos de LOD (ground true) que permita avaliar futuramente, em um trabalho de mestrado, a precis˜ao e a cobertura do m´etodo proposto.

1.1 OBJETIVO GERAL

O objetivo geral deste trabalho ´e desenvolver um m´etodo capaz de re-alizar a associac¸˜ao de dados sobre movimento a recursos de LOD, utilizando

1http://www.dbpedia.org/ 2linkedgeodata.org

(25)

23

informac¸˜oes espaciais e textuais, al´em de testar a implementac¸˜ao do m´etodo proposto em experimentos com dados reais.

1.2 OBJETIVOS ESPEC´IFICOS

Os objetivos espec´ıficos deste trabalho s˜ao:

• Estudar e avaliar medidas de proximidade textual e selecionar as ade-quadas para associar dados sobre movimento a recursos de LOD; • Propor um m´etodo que use a proximidade espacial entre posic¸˜oes

ocupadas por um objeto m´ovel e recursos (e.g., locais) descritos em colec¸˜oes de LOD, eventualmente o tempo e proximidade textual para associar dados sobre movimento a LOD;

• Implementar o m´etodo proposto e medir seu desempenho em experi-mentos;

• Descrever a proposta, os resultados obtidos e os trabalhos futuros em apresentac¸˜oes, artigos, relat´orios t´ecnicos e na monografia de con-clus˜ao de curso.

1.3 METODOLOGIA

A pesquisa inicia com a identificac¸˜ao do problema. S˜ao seleciona-das as principais ´areas do conhecimento envolviseleciona-das que s˜ao alvos durante a revis˜ao da literatura. O m´etodo ´e ent˜ao proposto e submetido a experimentos. O acompanhamento do trabalho conta com reuni˜oes semanais entre aluno e orientador, eventualmente com convidados. Durante as reuni˜oes s˜ao discutidos conceitos do estado da arte, propostas do m´etodo, prot´otipos, pla-nejamento de experimentos e aplicac¸˜ao dos experimentos. Os resultados obti-dos s˜ao discutiobti-dos e registraobti-dos em apresentac¸˜oes, artigos, relat´orios t´ecnicos e na presente monografia. Tamb´em faz parte do trabalho a participac¸˜ao em eventos da ´area para troca de experiˆencia com outros profissionais.

O m´etodo proposto conta com trˆes etapas principais. A primeira filtra todos os recursos de LOD (i.e., instˆancias de locais ou eventos) que est˜ao pr´oximos ao movimento. Em seguida, na segunda etapa, as anotac¸˜oes textuais do movimento e dos recursos s˜ao submetidas a um tratamento textuais para eliminar caracteres que possam prejudicar a an´alise textual. E por fim, o filtro textual seleciona, dos recursos encontrados no filtro espacial, os que possu´ırem boa proximidade textual.

(26)

24

Os dados sobre movimento s˜ao fornecidos por parceiros de projetos nacionais e internacionais. Dentre eles os projetos CoPhoIR3e SEEK4 (SE-mantic Enrichment of trajectory Knowledge discovery). Os dados ligados abertos est˜ao dispon´ıveis em terminais na Web. S˜ao dois exemplos de LOD, a DBPedia e o LinkedGeoData.

1.4 ORGANIZAC¸ ˜AO DO TRABALHO

Os pr´oximos cap´ıtulos est˜ao organizados da seguinte forma. O Cap´ıtulo 2 apresenta alguns fundamentos sobre dados ligados, dados sobre movimento e proximidade textual. O Cap´ıtulo 3 descreve o m´etodo proposto. O Cap´ıtulo 4 discute os experimentos realizados. O Cap´ıtulo 5 estuda o es-tado da arte de pesquisas em junc¸˜ao espac¸o-textual (spatiotextual similarity join), Entity Linking e problemas relacionados a associac¸˜ao de dados sobre movimento e LOD. Finalmente, o Cap´ıtulo 6 sumariza os resultados obtidos e apresenta propostas para evoluc¸˜ao do m´etodo.

3http://www.cophir.isti.cnr.it/ 4http://www.seek-project.eu

(27)

25

2 FUNDAMENTOS

O presente cap´ıtulo aborda LOD, dados sobre movimento e func¸˜oes de comparac¸˜ao textual, assuntos necess´arios ao desenvolvimento e entendimento do m´etodo proposto.

2.1 DADOS LIGADOS ABERTOS

Dados ligados abertos, do inglˆes Linked Open Data (LOD), sur-gem da necessidade de representar de forma padronizada, interligar e tornar acess´ıveis de maneira integrada e com semˆantica bem definida dados de di-versas fontes, para suportar consultas e aplicac¸˜oes via Web. A proposta de usar LOD foi alavancada por Timothy John Berners-Lee em (BERNERS-LEE; HENDLER; LASSILA, 2001) e a partir disso soluc¸˜oes e tecnologias vˆem sendo propostas.

Dados de diferentes dom´ınios do conhecimento precisam estar inter-ligados sem perderem o seu significado. Ontologias auxiliam a atingir este objetivo nas colec¸˜oes de dados ligados na Web semˆantica. Uma Ontologia ´e uma conceitualizac¸˜ao de um dom´ınio de conhecimento (GRUBER, 2007). As primitivas de representac¸˜ao de conhecimento em ontologias s˜ao basicamente classes, atributos e relacionamentos entre eles. A Figura 1 ilustra um trecho da ontologia extra´ıda do LinkedGeoData. As elipses representam recursos (i.e. classes ou instˆancias), as arestas as propriedades (i.e., os relacionamen-tos) e os retˆangulos literais quaisquer. Nota-se tamb´em a existˆencia de dois n´ıveis: o intencional e o extensional. No n´ıvel intencional s˜ao definidos os conceitos (i.e., classes) e propriedades da ontologia (i.e., relacionamento entre as classes). Os recursos do n´ıvel intencional formam a estrutura da ontologia. A partir do n´ıvel intencional s˜ao descritos outros recursos da ontologia (i.e., instˆancias) e seus relacionamentos, em acordo com as definic¸˜oes das respec-tivas classes e propriedades do n´ıvel intencional. Os recursos instanciados pertencem ao n´ıvel extensional.

Como usualmente em um banco de dados relacional, os dados na Web precisam ser identificados unicamente. URIs s˜ao utilizadas para identificar unicamente recursos na Web Semˆantica. Por exemplo, a URI que identifica o estabelecimento Bike Dream (exemplo ilustrado na Figura 1, tomado do LinkedGeoData) ´e http://linkedgeodata.org/triplify/node1492870690, comu-mente simplificada utilizando o prefixo lgd (e.g., lgd:node1492870690). Ou-tros exemplos de prefixos est˜ao ilustrados na Tabela 1. Ao submeter a URI de um recurso utilizando um navegador qualquer, todas as informac¸˜oes do

(28)

re-26 -27.58599 lgdo:Shop lgdo:BicycleShop lgdo:FloristShop lgd:BikeDream Bike Dream Nível Extensional (RDF) rdfs:label rdf:type rdfs:subClassOf rdfs:subClassOf Recurso Propriedade Literal Lengenda: Nível intencional (RDFS) -48.54958 geo:long geo:lat

Figura 1 – Trecho da ontologia do LinkedGeoData

curso, principalmente suas propriedades, ser˜ao apresentadas em uma p´agina HTML. A Figura 2 ilustra um trecho da p´agina na web do recurso do estabe-lecimento Bike Dream (i.e., URI lgd:node1492870690).

Figura 2 – Trecho da p´agina web ilustrando as propriedades de um recurso da ontologia do LinkedGeoData

O trecho da p´agina da web apresentada na Figura 2 n˜ao foi seleci-onada ao acaso. As trˆes propriedades seleciseleci-onadas ser˜ao menciseleci-onadas ao longo deste trabalho. S˜ao elas:

• rdfs:label: S˜ao r´otulos atribu´ıdos ao recurso, neste caso, o nome do recurso. Podem existir outros valores para esta mesma propriedade (e.g., o nome do estabelecimento em diferentes l´ınguas); e

• geo:lat e geo:long: S˜ao as coordenadas geogr´aficas latitude e longitude respectivamente do recurso no espac¸o geogr´afico.

(29)

27

Tabela 1 – Tabela de prefixos

Prefixo URI lgd http://linkedgeodata.org/triplify/ lgdo http://linkedgeodata.org/ontology/ rdf http://www.w3.org/1999/02/22-rdf-syntax-ns# rdfs http://www.w3.org/2000/01/rdf-schema# geo http://www.w3.org/2003/01/geo/ owl http://www.w3.org/2002/07/owl# dbpedia-owl http://dbpedia.org/ontology/ dbpedia http://dbpedia.org/resource/ ogc http://www.opengis.net/ont/geosparql# bif http://www.openlinksw.com/schemas/bif#

Ontologias s˜ao representadas formalmente para que m´aquinas sejam capazes de process´a-las. O RDF (Resource Description Framework) ´e uma linguagem utilizada para descrever recursos na Web, incluindo conceitos, instˆancias e suas propriedades na forma de triplas. Cada tripla RDF tem a forma rd f (u, pr, v), onde:

• u ´e uma URI identificando um recurso na Web; • pr ´e uma propriedade; e

• v ´e o valor da propriedade, que pode ser um literal ou a URI de um outro recurso.

O RDF ´e baseado no modelo de triplas, mas um RDF pode ser ex-presso na linguagem XML (Extensible Markup Language). Assim como XML Schema descreve o esquema de um documento XML, especificac¸˜oes em RDFS descrevem as classes, propriedades e relac¸˜oes v´alidas para as res-pectivas instˆancias descritas em RDF. A Figura 3 ilustra o arquivo RDF que descreve o trecho da ontologia presente na Figura 1. Cada tag rdf:Description descreve um recurso, suas propriedades e valores. Por exemplo, o recurso lgdo:Shop possui uma propriedade rdf:type cujo valor ´e um outro recurso identificado pela URI rdfs:Class.

O valor da propriedade de um recurso em uma ontologia pode menci-onar um recurso de uma outra ontologia. A Figura 4 ilustra uma ligac¸˜ao exis-tente entre ontologias das colec¸˜oes de LOD DBPedia1 e LinkedOpenData. Por exemplo, a propriedade owl:sameAs ´e utilizada para ligar dois recursos que representam a mesma entidade em duas ontologias diferentes. No exem-plo da Figura 4, cada reposit´orio de LOD possui um recurso que representa a

(30)

28 <?xml version="1.0"?> <rdf:RDF xmlns:lgd="http://linkedgeodata.org/triplify/" xmlns:lgdo:"http://linkedgeodata.org/ontology/>" xmlns:rdf:"http://www.w3.org/1999/02/22-rdf-syntax-ns#>" xmlns:rdfs:"http://www.w3.org/2000/01/rdf-schema#>" xmlns:geo:"http://www.w3.org/2003/01/geo/>"> <rdf:Description rdf:about="lgdo:Shop">

<rdf:type rdf:resource="rdfs:Class"/> </rdf:Description>

<rdf:Description

rdf:about="lgdo:BicycleShop">

<rdf:type rdf:resource="rdfs:Class"/> <rdfs:subClassOf

rdf:resource="lgdo:Shop"/> </rdf:Description>

<rdf:Description

rdf:about="lgdo:FloristShop">

<rdf:type rdf:resource="rdfs:Class"/> <rdfs:subClassOf

rdf:resource="lgdo:Shop"/> </rdf:Description>

<rdf:Description

rdf:about="lgd:node1492870690">

<rdf:type rdf:resource="lgdo:BicycleShop"/> <rdfs:label xml:lang="pt">Bike Dream</rdfs:label> <geo:lat>-27.58599</geo:lat>

<geo:long>-48.54958</geo:long> </rdf:Description>

</rdf:RDF>

(31)

29

cidade de Florian´opolis. Os dois recursos s˜ao ligados atrav´es da propriedade owl:sameAs.

Figura 4 – Exemplo real da ligac¸˜ao existente entre duas ontologias distintas (LinkedGeoData e DBPedia) owl:Class lgdo:City owl:Class dbpedia-owl:Place Florianópolis dbpedia:Florianópolis lgd/node90200226 Florianópolis rdf:type rdf:type rdf:type rdf:type rdfs:label rdfs:label

LinkedGeoData

DBPedia

owl:sameAs

Depois de armazenar os dados em reposit´orios RDF, pode-se con-sult´a-los. O SPARQL ´e uma linguagem de consulta e manipulac¸˜ao de dados armazenados em reposit´orios RDF. Ela possui expressividade equivalente a da ´algebra relacional e consequentemente `a SQL (ANGLES; GUTIERREZ, 2008)(SHETH et al., 2008). Para recuperar, por exemplo, os recursos que s˜ao do tipo loja de bicicleta (lgdo:BicycleShop), deve-se executar a consulta ilustrada na Figura 5.

select ?recurso

where {

?recurso rdf:type lgdo:BicycleShop. }

Figura 5 – Consulta SPARQL que recupera recursos que sejam do tipo (rdf:type) lgdo:BicycleShop

Outro exemplo de consulta, um pouco mais complexa que a anterior, envolvendo operador geogr´afico ´e ilustrado na Figura 6. Tal consulta retorna todos os recursos que est˜ao a menos de 100 metros de distˆancia do ponto geogr´afico informado.

(32)

30 select ?recurso where { ?recurso geom:geometry [ ogc:asWKT ?g ]. filter(bif:st_intersects ( ?g, bif:st_point (-48.55021, -27.586136), 0.1) ). }

Figura 6 – Consulta SPARQL que recupera recursos a pelo menos 100 metros de distˆancia da coordenada (-48.55021, -27.586136)

Atrav´es das tecnologias apresentadas nesta sec¸˜ao, ´e poss´ıvel repre-sentar, interligar e consultar conhecimento de diversas ´areas em colec¸˜oes de LOD. Uma definic¸˜ao completa para dados ligados abertos ´e representado pela Definic¸˜ao 1.

Definic¸˜ao 1. Dados Ligados Abertos (LOD) s˜ao colec¸˜oes de dados distintas, interligadas, p´ublicas, com semˆantica bem definida e formalmente estrutura-das segundo os padr˜oes da Web Semˆantica.

2.2 DADOS SOBRE MOVIMENTO

Uma sequˆencia de dados sobre movimento, em inglˆes Movement Data, ´e uma sequˆencia de amostras de posic¸˜oes de um objeto m´ovel, cada qual co-letada em um instante no tempo, e por vezes acrescidas de anotac¸˜oes tex-tuais. Uma sequˆencia de dados sobre movimento ´e uma generalizac¸˜ao para trajet´orias de objetos m´oveis (PARENT et al., 2013) e trilhas de usu´arios em m´ıdias sociais (NABO et al., 2014). A generalizac¸˜ao de tais conceitos torna o m´etodo proposto neste trabalho funcional para diferentes conjuntos de dados (e.g., trajet´orias, trilhas, fus˜ao de trilhas e trajet´orias). A Figura 7 ilustra um conjunto de trajet´orias reais. Nota-se que elas possuem alta frequˆencia de co-leta de amostras de posic¸˜oes, i.e., suas posic¸˜oes s˜ao coco-letadas em intervalos de tempo e espac¸o pequenos (e.g., a cada 3 segundos, a cada 10 metros). Por outro lado, trilhas como as ilustradas na Figura 8 possuem frequˆencia de

(33)

co-31

leta baixa e ass´ıncrona (a intervalos n˜ao regulares). Todavia, elas geralmente s˜ao dotadas de mais conte´udo (e.g., fotos, anotac¸˜oes textuais).

Figura 7 – Trajet´orias, adaptado de (NABO et al., 2014)

Figura 8 – Trilhas, adaptado de (NABO et al., 2014)

A Definic¸˜ao 2 formaliza o conceito de sequˆencia de dados sobre movimento, uma generalizac¸˜ao de trajet´orias e trilhas. O movimento n˜ao ´e considerado semˆantica pois uma colec¸˜ao de palavras livremente anotados por usu´ario, por exemplo, n˜ao fornece informac¸˜oes suficientes para executar consultas relevantes para o movimento.

Definic¸˜ao 2. Sequˆencia de dados sobre movimento MD ´e uma sequˆencia temporalmente ordenada de amostras de posic¸˜oes p1, ..., pn de objetos m´oveis. Cada posic¸˜ao pitem a formapi((xi,yi),ti,Si), onde:

• (xi,yi) s˜ao coordenadas geogr´aficas; • ti´e um instante de tempo; e

• Si= {s1, ..., sl} ´e uma colec¸˜ao de valores textuais de atributos associa-dos `a amostra de posic¸˜ao espac¸o-temporal (e.g., palavras-chave, tags).

(34)

32

Note que nesta definic¸˜ao gen´erica posic¸˜oes podem se referir a posic¸˜oes amostradas de trajet´orias ou trilhas, mas tamb´em a epis´odios (e.g., stops) de trajet´orias. Obviamente, os mesmos valores textuais podem ser usados para anotar uma subsequˆencia de posic¸˜oes, sendo mais eficiente associar tais valores a todas as sub-sequˆencias a que se referem. Por´em, por simplicidade preferimos n˜ao normalizar as anotac¸˜oes na Definic¸˜ao 2. A Figura 9 ilustra uma sequˆencia de dados sobre movimento. Cada amostra de posic¸˜ao est´a representada por um ponto.

p1((x1,y1),t1,S1) ... pn((xn,yn),tn,Sn)

Legenda:

Amostra de posição

Figura 9 – Sequˆencia de dados sobre movimento

Existem casos em que sequˆencias de dados sobre movimento n˜ao s˜ao suficientes para responder consultas tais como: “Quais objetos m´oveis esti-veram em locais tur´ısticos?”. Para responder tal tipo de consulta ´e necess´ario que cada amostra de posic¸˜ao esteja precisamente anotada semanticamente com as classes dos locais visitados. Preferencialmente, os dados sobre movimento precisam ser associados a itens de informac¸˜ao (e.g., um hotel, um restaurante, um local de interesse tur´ıstico) com definic¸˜oes precisas e com semˆantica bem definida, tais como recursos presentes em colec¸˜oes de LOD (FILETO et al., 2013). A Definic¸˜ao 3 formaliza o conceito de sequˆencia semˆantica de dados sobre movimento. Ela difere da anterior pois permite que uma consulta semˆantica, utilizando a linguagem SPARQL, seja realizada para encontrar mais informac¸˜oes sobre o movimento (e.g., classe do local que a pessoa visitou).

Definic¸˜ao 3. Sequˆencia semˆantica de dados sobre movimento SMD ´e uma sequˆencia temporalmente ordenada de posic¸˜oes semanticamente ano-tadasps1, ..., psn. Cada posic¸˜ao semanticamente anotada psi tem a forma psi(pi,Ai), onde:

(35)

33

• Ai´e uma colec¸˜ao de anotac¸˜oes semˆanticas da formaa(pr,v), onde pr ´e a propriedade que associa a posic¸˜aopiao recursov descrito em uma colec¸˜ao de LOD.

A Figura 10 ilustra uma sequˆencia semˆantica de dados sobre movi-mento. Os recursos e propriedades das anotac¸˜oes est˜ao representados por bal˜oes verdes associados atrav´es de propriedades a algumas posic¸˜oes.

dbpedia:Universidade_Federal_de_Santa_Catarina lgd:node1492870690 menciona menciona ps1(p1, (a1)) ... psn(pn, (am)) Legenda: Amostra de posição Recurso Propriedade

Figura 10 – Sequˆencia semˆantica de dados sobre movimento

2.3 FUNC¸ ˜OES DE COMPARAC¸ ˜AO TEXTUAL

Func¸˜oes de comparac¸˜ao textual podem ajudar a encontrar diferentes representac¸˜oes textuais de uma mesma entidade do mundo real em diferentes colec¸˜oes de dados. Existem diferentes maneiras de referenciar textualmente um conceito (classe) ou entidade nomeada. Entre elas se destacam as pala-vras simples (e.g., “cidade”, “estado”), as palapala-vras compostas (e.g. “Rio de Janeiro”, “S˜ao Paulo”), frases (e.g. “Eu fui a cidade do Rio de Janeiro”), documentos (i.e. composic¸˜ao de diversas palavras organizadas segundo uma gram´atica) e as palavras livres (i.e. que n˜ao respeitam o vocabul´ario)(e.g., “#riodejaneiro”, “#cristoredentor”).

Definic¸˜ao 4. Uma cadeia de caracteres s= c[1], ..., c[l], do inglˆes string, ´e uma sequencia ordenada de caracteres (s´ımbolos), onde:

• c[i] ´e o i-´esimo s´ımbolo; e

• ls´e a quantidade de s´ımbolos existentes na cadeias (i.e., o tamanho da cadeia).

(36)

34

Uma cadeia de caracteres pode representar uma palavra simples, composta ou livre.

Doravante, para simplificar a leitura, cadeia de caracteres ser´a cha-mada de palavra. O conjunto de palavras define uma colec¸˜ao de palavras. Definic¸˜ao 5. Uma colec¸˜ao de palavras ´e um conjunto S= {s1, ..., sL}, onde:

• si´e a i-´esima palavra da colec¸˜ao; e

• |S| ´e a quantidade de palavras presente na colec¸˜ao.

Func¸˜oes de comparac¸˜ao textual neste trabalho ser˜ao classificadas em func¸˜oes de comparac¸˜ao de palavras, func¸˜oes de comparac¸˜ao entre ocorrˆencias de palavras e func¸˜oes de comparac¸˜ao textuais h´ıbridas. Uma func¸˜ao de comparac¸˜ao de palavras aceita como entrada duas palavras. O resultado da func¸˜ao ´e um n´umero que representa a distˆancia ou similaridade entre as pala-vras. S˜ao exemplos de func¸˜oes de comparac¸˜ao de palavras Levenshtein, Jaro e Jaro-Winkler.

Definic¸˜ao 6. Uma func¸˜ao de comparac¸˜ao de palavras s1e s2´e uma func¸˜ao WordSim(s1, s2). O resultado da func¸˜ao pode ser uma medida de distˆancia (variando entre zero e infinito) ou de similaridade (usualmente variando entre zero e um) entre as palavras.

A func¸˜ao Levenshtein mede a distˆancia entre duas palavras s1e s2de acordo com a quantidade de operac¸˜oes de inserc¸˜ao, remoc¸˜ao e substituic¸˜ao dos caracteres necess´arias para transformar s1 em s2. A Figura 11 ilustra um exemplo de aplicac¸˜ao da func¸˜ao Levenshtein, onde s1= f lorianopolis e s2= f loripa. Os caracteres em vermelho e azul representam operac¸˜oes de remoc¸˜ao e substituic¸˜ao respectivamente. Portanto, a distˆancia entre s1= “ f lorianopolis” e s2= “ f loripa” utilizando a func¸˜ao de comparac¸˜ao textual Levenshtein s˜ao sete operac¸˜oes.

Figura 11 – Exemplo de aplicac¸˜ao da func¸˜ao Levenshtein cujo resultado s˜ao sete operac¸˜oes de edic¸˜ao

A func¸˜ao Jaro mede a similaridade entre duas palavras s1e s2. Nesta func¸˜ao, um caractere cs1[i] em s1´e comum a s2se existe pelo menos cs2[ j] = cs1[i] em s2 tal que i − H ≤ j ≤ i + H, onde H =

min(ls1,ls2)

(37)

35 s01= c0s 1[1]...c 0 s1[l 0

] sendo os caracteres de s1em comum a s2, e vice e versa. O n´umero de transposic¸˜oes Ts0

1s02 ´e igual a metade do n´umero de transposic¸˜oes entre s01e s02(i.e. o n´umero de c0s

1[i] 6= c 0

s2[i]). Finalmente podemos aplicar a Equac¸˜ao 2.1.

Jaro(s

1

, s

2

) =

1

3

×

l

s0 1

l

s1

+

l

s0 2

l

s2

+

l

s0 1

− T

s01,s02

l

s0 1

!

(2.1)

Considere o exemplo de aplicac¸˜ao da func¸˜ao Jaro entre s1 = ” f lorianopolis” e s2 = ” f loripa”. As palavras em comum ser˜ao s01 = ” f loriap” e s02= ” f loripa”. O n´umero de transposic¸˜oes Ts0

1s02= 2

2= 2. Por-tanto, Jaro(s1, s2) = 0, 7985.

A func¸˜ao Jaro-Winkler tamb´em mede a similaridade entre duas pala-vras s1e s2. Esta func¸˜ao incrementa o resultado da func¸˜ao Jaro para palavras que possuem os primeiros caracteres em comum (prefixos). Considere lpo tamanho do prefixo comum entre s1 e s2e l0p= min(lp, 4). A func¸˜ao Jaro-Winkler ´e calculada atrav´es da Equac¸˜ao 2.2 com uma constante a para ajuste da similaridade.

Jaro−Winkler(s1, s2) = Jaro(s1, s2) + a × l0p× (1 − Jaro(s1, s2)) (2.2)

Considerando o exemplo anterior onde s1= ” f lorianopolis” e s2= ” f loripa” aplicado a func¸˜ao Jaro. O m´ınimo entre tamanho do prefixo co-mum e o valor quatro ´e l0p= 4. Aplicando a func¸˜ao Jaro-Winkler com a constante de ajuste a = 0, 1 temos Jaro −Winkler(s1, s2) = 0, 8791.

As func¸˜oes de comparac¸˜ao entre ocorrˆencias de palavras aceitam como entrada duas colec¸˜oes de palavras e resultam na distˆancia ou simila-ridade entre as colec¸˜oes de acordo com as ocorrˆencias. S˜ao exemplos de func¸˜oes de comparac¸˜ao entre ocorrˆencias de palavras o Modelo Booleano, o Modelo Vetorial e o Modelo Probabil´ıstico.

Definic¸˜ao 7. Uma func¸˜ao de comparac¸˜ao entre ocorrˆencias de palavras OcurSim(S1, S2) mede a distˆancia (i.e. variando entre zero e infinito) ou a similaridade (i.e. usualmente entre zero e um) entre as colec¸˜oes de palavras S1e S2baseado na ocorrˆencia das palavras.

O Modelo Booleano compara duas colec¸˜oes de palavras baseado nas ocorrˆencias das palavras. Quanto maior o n´umero de correspondˆencias exatas

(38)

36

entre palavras contidas nas colec¸˜oes de palavras, mais similares ou menos dis-tantes os conjuntos de palavras ser˜ao. A Tabela 2 exemplifica a comparac¸˜ao entre as colec¸˜oes de palavras S1= {“Florian´opolis”, “Universidade”, “Fe-deral”, “de”, “Santa”, “Catarina”} e S2= {“Florian´opolis”, “Universidade”, “Centro”, “de”, “Cultura”, “e”, “Eventos”}. Nota-se que as palavras pre-sentes nas colec¸˜oes precisam ser exatamente iguais para serem consideradas. Al´em disso, cada correspondˆencia exata tem a mesma pontuac¸˜ao (e.g., um para correspondˆencia exata, zero para n˜ao correspondˆencia), independente da palavra. A partir da Tabela 2 podemos calcular a comparac¸˜ao entre duas colec¸˜oes de palavras utilizando o Modelo Booleano (i.e. raz˜ao de corres-pondˆencia de palavras e o total de palavras).

Tabela 2 – Exemplo de comparac¸˜ao entre ocorrˆencias de palavras utilizando Modelo Booleano

Florian´opolis Universidade Federal de Santa Catarina

Florian´opolis 1 0 0 0 0 0 Universidade 0 1 0 0 0 0 Centro 0 0 0 0 0 0 de 0 0 0 1 0 0 Cultura 0 0 0 0 0 0 e 0 0 0 0 0 0 Eventos 0 0 0 0 0 0

O Modelo Vetorial compara duas colec¸˜oes de palavras baseado nas ocorrˆencias de palavras, assim como o Modelo Booleano. No entanto, acres-centa pesos no calculo da ocorrˆencia entre palavras de acordo com a sua re-levˆancia para um determinado dom´ınio. O peso de uma palavra, do inglˆes Term Weight, ´e a importˆancia (peso) da palavra para uma determinada colec¸˜ao de palavras. Palavras que aparecem com frequˆencia alta ser˜ao menos rele-vantes (e.g. preposic¸˜oes), portanto, ter˜ao peso menor. O peso de uma palavra wsiSj ´e a medida da importˆancia de uma palavra sipertencente a colec¸˜ao de palavras Sj. Cada palavra s presente em S deve possuir um peso w.

Considere lvsendo o n´umero de palavras iguais entre as duas colec¸˜oes de palavras comparadas. A equac¸˜ao do Modelo Vetorial est´a ilustrada na Equac¸˜ao 2.3. A equac¸˜ao do modelo vetorial soma o produto dos pesos das palavras e a normaliza para obter a similaridade entre duas colec¸˜oes de pala-vras.

(39)

37

VectorSim(S

1

, S

2

) =

lv i=1

w

si,S1

× w

si,S2

q

li=1v

w

2si,S1

×

q

li=1v

w

2si,S2

(2.3)

As func¸˜oes de comparac¸˜ao textual h´ıbridas combinam t´ecnicas de func¸˜oes de comparac¸˜ao de palavras e entre ocorrˆencias de palavras. Isto signi-fica que estas func¸˜oes verisigni-ficam as ocorrˆencias das palavras similares entre duas colec¸˜oes de palavras, como na Tabela 3. Um exemplo de func¸˜ao de comparac¸˜ao textual h´ıbrida ´e o SoftTFIDF (COHEN; RAVIKUMAR; FIEN-BERG, 2003).

Definic¸˜ao 8. Uma func¸˜ao de comparac¸˜ao textual h´ıbrida ´e uma func¸˜ao que dadas duas colec¸˜oes de palavras S1 e S2 e um limiar textual τt mede as ocorrˆencias de palavras similares (duas palavras si e sj s˜ao similares se WordSim(si, sj) > τt) segundo uma func¸˜ao de comparac¸˜ao textual de pala-vras (e.g., Jaro-Winkler). O resultado ´e a distˆancia (i.e. variando entre zero e infinito) ou a similaridade (i.e. usualmente variando entre zero e um) entre as duas colec¸˜oes de palavras.

Tabela 3 – Exemplo de verificac¸˜ao da ocorrˆencias de palavras similares para τs= 0, 8 #christredeemer #riodejaneiro ... Christ 0.8857 0.5 the 0.4683 0 Redeemer 0.5119 0.6525 Rio 0 0.825 de 0 0 Janeiro 0.3095 0.3175 Corcovado 0.5643 0.5241 ...

A Equac¸˜ao 2.4 ´e utilizada para o c´alculo da comparac¸˜ao textual h´ıbrida entre duas colec¸˜oes de palavras S1e S2. Para isso, considere Scsendo uma colec¸˜ao de palavras sital que si∈ S1,sj∈ S2e WordSim(si, sj) > τt. E para sc∈ Sc, deixe sim0(sc, S2) = maxsj∈S2WordSim(sc, sj). Em seguida pode-se calcular a similaridade entre duas colec¸˜oes de palavras.

(40)

38

So f tT FIDF(S

1

, S

2

, τ

t

) =

sc∈Sc

w

sc,S1

.w

sc,S2

.sim

0

(s

c

, S

2

)

(2.4)

(41)

39

3 M ´ETODO PROPOSTO

O m´etodo proposto almeja o enriquecimento semˆantico de dados sobre movimento textualmente anotados atrav´es da associac¸˜ao a recursos de LOD. Sua vers˜ao atual utiliza proximidade espacial e textual.

O processo proposto para efetuar a associac¸˜ao consiste em encontrar recursos de colec¸˜oes de LOD que representam o local que um objeto m´ovel visitou ou mencionou. O processo simplificado ´e composto por trˆes etapas organizadas na seguinte ordem: (i) filtro espacial, (ii) pr´e-processamento tex-tual e (iii) filtro l´exico, como ilustra a Figura 12. O filtro espacial seleciona todos os recursos da colec¸˜ao de LOD fornecida que est˜ao pr´oximos, segundo a distˆancia euclidiana, a cada posic¸˜ao dos dados sobre movimento. Em se-guida ´e realizado um pr´e-processamento textual com a finalidade de eliminar caracteres que possam prejudicar o filtro l´exico. Por fim, o filtro l´exico de-termina que recursos s˜ao relevantes para a associac¸˜ao segundo proximidade textual utilizando SoftTFIDF.

(i) Filtro espacial (ii) Pré-processamentoTextual (iii) Filtro léxico Entradas: - MD - LOD - Limiar espacial - Limiar textual Saída: - SMD

Figura 12 – Fluxo das principais etapas do algoritmo

O m´etodo proposto ´e formalmente descrito pelo Algoritmo 1. As en-tradas para o m´etodo proposto s˜ao quatro: (i) a sequˆencia de dados sobre movimento, (ii) uma colec¸˜ao de LOD referente `a mesma regi˜ao e per´ıodo de tempo que os dados sobre movimento foram coletados, (iii) limiar espacial e (iv) limiar textual. A sa´ıda no algoritmo ´e a sequˆencia semˆantica de dados sobre movimento anotados com recursos da colec¸˜ao de LOD fornecida.

Percebe-se que o m´etodo n˜ao faz nenhum pr´e-processamento para simplificar a sequˆencia de dados sobre movimento fornecida, por exemplo, encontrar epis´odios (i.e., segmentos maximais n˜ao aninhados de amostras do movimento que cumprem um predicado, e.g., stops e moves (MOUN-TAIN; RAPER, 2001)). O m´etodo proposto ´e desenvolvido para funcionar com quaisquer dados sobre movimento textualmente anotados, sejam eles trajet´orias (brutas ou estruturadas em stops e moves, por exemplo), trilhas de usu´arios ou resultados de fus˜oes das primeiras com as ´ultimas. Basta ajustar os parˆametros de acordo com o conjunto de dados sobre movimento forne-cido. Trilhas n˜ao possuem precis˜ao na coordenada geogr´afica, logo, o limiar espacial pode ser maior. Trajet´orias possuem boa precis˜ao espacial, logo, um

(42)

40

limar espacial pequeno ´e mais adequado. No entanto, ´e importante conhecer bem os dados e o m´etodo proposto, pois o mal uso dos parˆametro prejudica muito a qualidade do resultado.

Algoritmo 1: Func¸˜ao associa

Entrada: MD //Sequˆencia de dados sobre movimento textualmente anotados

LOD//Colec¸˜ao de LOD τs//Limiar espacial τt//Limiar textual

Sa´ıda: SMD //Sequˆencia semˆantica de dados sobre movimento 1 in´ıcio

2 para i = 0 at´e |MD| − 1 fac¸a

3 p← MD[i]

4 rProximos← filtraEspacialmente(p, LOD, τs) 5 eliminaCaracteresEspeciais(p)

6 eliminaCaracteresEspeciais(rProximos) 7 recursos← filtraLexicamente(p, rProximos, τt)

8 A← /0

9 para cada r ∈ recursos fac¸a 10 A← A ∪ a(menciona, r.recurso) 11 fim 12 SMD[i] ← ps(p, A) 13 fim 14 retorna SMD 15 fim

Exemplo 1. Para exemplificar o funcionamento do m´etodo proposto no Algoritmo 1, considere a investigac¸˜ao de associac¸˜ao de dados sobre mo-vimento com anotac¸˜oes textuais livres a recursos (i.e., instˆancias de locais) de dados ligados atrav´es de suas posic¸˜oes e r´otulos (valores da propriedade rdfs:label), com as seguintes entradas para o m´etodo:

• MD com apenas uma posic¸˜ao

p1((−48.549577, −27.585917),02007 − 01 − 15 15 : 35 : 160, (0bike0,0wheel0)); • LOD sendo colec¸˜ao do LinkedGeoData;

• τsigual a 100 metros; e • τt igual a 0,4.

Inicialmente, na linha 2, o m´etodo executa uma iterac¸˜ao para enrique-cer semanticamente cada posic¸˜ao da sequˆencia de dados sobre movimento fornecida. No exemplo 1 existe apenas uma posic¸˜ao na sequˆencia de dados

(43)

41

sobre movimento, logo, o algoritmo executa a iterac¸˜ao apenas uma vez para a ´unica posic¸˜ao.

A func¸˜ao filtraEspacialmente, presente na linha 4, seleciona todos os recursos a uma distˆancia menor que o limiar espacial τs de cada amostra de posic¸˜ao. A Figura 13 ilustra a aplicac¸˜ao do filtro espacial para o exem-plo 1, em que dois recursos (indicadores vermelhos dentro da circunferˆencia preta) s˜ao selecionados por estarem a uma distˆancia menor que 100 metros da posic¸˜ao p1(indicador amarelo no centro da figura). Para simplificar, abs-tra´ımos as anotac¸˜oes textuais na imagem.

Figura 13 – Filtro espacial

A func¸˜ao eliminaCaracteresEspeciais, presente nas linhas 5 e 6, cor-responde ao pr´e-processamento textual. Ela consiste em eliminar caracteres das representac¸˜oes textuais que possam prejudicar o resultado da aplicac¸˜ao de func¸˜oes de comparac¸˜ao textual. Por exemplo, a eliminac¸˜ao de caracteres asterisco, parˆenteses, chaves e barra. No exemplo 1 os r´otulo dos recursos re-cursos selecionados no filtro espacial, ilustrados na Tabela 4 n˜ao apresentam nenhum caractere que prejudique a proximidade textual.

A func¸˜ao filtraLexicamente, presente na linha 7, analisa o conjunto de palavras de cada par epis´odio-recurso para encontrar os recursos com va-lores de propriedades textuais (e.g., r´otulos) similares a anotac¸˜oes (e.g., pala-vras) associadas a posic¸˜ao p = MD[i] em an´alise dos dados sobre movimento segundo a func¸˜ao SoftTFIDF (COHEN; RAVIKUMAR; FIENBERG, 2003). Ela ´e adequada para o m´etodo pois combina func¸˜ao de comparac¸˜ao textual en-tre ocorrˆencias de palavras (e.g., modelo vetorial) e func¸˜ao de comparac¸˜ao de palavras (e.g., Jaro-Winkler), constituindo assim uma func¸˜ao de comparac¸˜ao

(44)

42

textual h´ıbrida. Seu funcionamento est´a detalhado na Sec¸˜ao 2.3. Os recursos que possu´ırem similaridade textual superior ao limiar textual τt s˜ao selecio-nados. A Tabela 4 ilustra o resultado da aplicac¸˜ao da func¸˜ao de similaridade textual para o Exemplo 1. A func¸˜ao ´e aplicada `as anotac¸˜oes textuais de cada par epis´odio-recurso. Percebe-se que o primeiro recurso n˜ao ´e selecionado, pois a similaridade textual entre a amostra de posic¸˜ao e o recurso foi inferior ao limiar determinado no exemplo (0,4). O segundo recurso ´e selecionado, pois a similaridade textual entre anotac¸˜oes textuais da amostra de posic¸˜ao e os r´otulos do recurso selecionado ´e superior a 0,4.

Tabela 4 – Proximidade textual

URI do recurso R´otulo

(rdfs:label) Similaridade l´exica (SoftTFIDF) linkedgeodata.org/triplify/node1685780692 Monumento ao Soldado 0

linkedgeodata.org/triplify/node1492870690 Bike Dream 0,49

Ap´os encontrar os recursos pr´oximos espacial e textual-mente, nas linhas 9, 10 e 11 s˜ao instanciadas todas as anotac¸˜oes semˆanticas com os recursos. Em seguida, na linha 12, a nova posic¸˜ao semˆantica ´e adicionada a sequˆencia semˆantica de dados sobre movimento. O resultado da aplicac¸˜ao do algoritmo para o exemplo ´e uma sequˆencia semˆantica de dados sobre movimento ps1(p1, (a1(menciona, linkedgeodata.org/tripli f y/node1492870690))).

A Figura 14 ilustra a amostra de posic¸˜ao utilizada no exemplo. O canto inferior direito mostra uma imagem de sat´elite da regi˜ao e o restante da figura uma foto daquela regi˜ao, ambas obtidas do Google Maps1. O bal˜ao sobre a imagem de sat´elite representa a posic¸˜ao de uma postagem no Flickr2que foi associada `as palavras-chave apresentadas acima do bal˜ao amarelo (wheel, violet, toy, roda, etc.).

Uma extens˜ao poss´ıvel para o m´etodo proposto ´e a identificac¸˜ao da melhor propriedade para a associac¸˜ao realizada, diferente do atual que adici-ona a propriedade menciadici-ona a todas as associac¸˜oes.

1https://maps.google.com/ 2https://www.flickr.com/

(45)

43

(46)
(47)

45

4 EXPERIMENTOS

As sequˆencias de dados sobre movimento utilizadas na experimentac¸˜ao foram extra´ıdas do CoPhIR1. Tais dados referem-se a fotos e dados associados (posic¸˜ao, momento, anotac¸˜oes textuais, etc.) publicados na m´ıdia social Flickr2 contidas no Brasil nos anos de 2005 a 2007. A Figura 15 ilustra a distribuic¸˜ao espacial das postagens do Flickr na geometria do Brasil. Utilizaremos tags (anotac¸˜oes textuais livres feitas pelos usu´ario) associadas a cada posic¸˜ao como sua descric¸˜ao textual.

Figura 15 – Distribuic¸˜ao das postagens do Flickr na geometria do Brasil Para enriquecer semanticamente os dados sobre movimento oriundos do Flickr utilizamos a colec¸˜ao de LOD do LinkedGeoData que cont´em da-dos triplificada-dos (processo de convers˜ao de bases de dada-dos relacionais em colec¸˜oes de triplas RDF) do OpenStreetMap3(ferramenta da coleta colabora-tiva de dados geogr´aficos). Utilizaremos os r´otulos dos recursos (i.e., valores da propriedade rdfs:label) para investigar as associac¸˜oes l´exicas com tags as-sociadas aos dados sobre movimento.

A Tabela 5 ilustra as tags frequentemente utilizadas no conjunto de 1http://cophir.isti.cnr.it

2http://www.flickr.com 3http://www.openstreetmap.org

(48)

46

dados dos experimentos. Percebemos que existem muitas palavras desres-peitando regras gramaticais (e.g., sem acentuac¸˜ao, palavras compostas sem separac¸˜ao). Isto ocorre pois os usu´arios podem escrever livremente em suas publicac¸˜oes (i.e., anotac¸˜oes livres). Devido a este fato, para esta base de da-dos, devemos utilizar um filtro l´exico mais flex´ıvel (n´umero menor), pois a correspondˆencia exata ocorrer´a com baixa frequˆencia.

Tabela 5 – Tags frequentemente utilizadas

Tags N ´umero de ocorrˆencias Tags N ´umero de ocorrˆencias

brazil 13539 2006 1328 brasil 12602 canon 1278 riodejaneiro 2999 saopaulo 1261 s˜aopaulo 2374 nature 1212 beach 2019 janeiro 1170 rio 1944 pb 1132 bahia 1922 salvador 1119 praia 1764 sky 1096 brasilia 1628 bw 1027 de 1535 curitiba 1026

Para conhecer melhor os dados utilizados na experimentac¸˜ao, aplicou-se a medida de distˆancia l´exica Jaro Winkler entre cada par tag de foto e r´otulo de recurso a aproximadamente 1 quilˆometro distante (utilizando a distˆancia euclidiana) para entender como o filtro l´exico se comporta. Utilizamos a func¸˜ao de proximidade textual Jaro Winkler porque ao analisar visualmente alguns resultados da aplicac¸˜ao de diferentes func¸˜oes de proximidade textual aos dados utilizados neste experimente, foi a func¸˜ao que obteve maior n´umero de associac¸˜oes corretas (i.e., os registros associados representavam a mesma entidade do mundo real). No entanto, sabe-se que esta n˜ao ´e a melhor maneira para selecionar uma func¸˜ao de proximidade textual. O resultado est´a ilustrado na Figura 16. A quantidade de recursos relacionados diminui `a medida que a distˆancia l´exica aumenta. E enquanto a distˆancia l´exica diminui o n´umero de fotos aumenta, com excec¸˜ao para o valor 1 da proximidade textual que apresenta grande concentrac¸˜ao de fotos (i.e., a cor da bolinha se aproxima muito da cor preta).

Os experimentos foram realizados em uma m´aquina com processa-dor Intel(R) Core(TM) 2 Quad 2.40GHz, com 4Gb de mem´oria RAM e um disco r´ıgido de 500 Gb 7200 RPM. O algoritmo para efetuar a associac¸˜ao foi desenvolvido utilizando a linguagem Java. A implementac¸˜ao da func¸˜ao de comparac¸˜ao textual SoftTFIDF utilizada ´e p´ublica e de c´odigo aberto, mantida pelo projeto SecondString4. Os dados espac¸o-temporais foram

(49)

47

Figura 16 – Distribuic¸˜ao de similaridade l´exica (recursos a 1024 metros de distˆancia)

mazenados e manipulados em uma base de dados PostgreSQL, utilizando a extens˜ao geogr´afica PostGIS.

A Figura 17 ilustra o banco de dados desenvolvido para suportar a implementac¸˜ao do algoritmo. Na tabela “posicao”foram armazenados os re-gistros referentes as posic¸˜oes dos dados sobre movimento. Nas tabelas “re-curso”e “rotulo”foram armazenados os recursos de LOD coletados do Lin-kedGeoData e seus r´otulos (valores textuais da propriedade rdf:label) res-pectivamente. E a tabela “associacao”armazena o resultado da execuc¸˜ao do algoritmo, ou seja, a associac¸˜ao entre dados sobre movimento e recursos de colec¸˜oes de LOD segundo os limiares espacial e textual.

4.1 RESULTADOS

Submetemos 36.476 amostras de posic¸˜oes de usu´arios do Flickr ao algoritmo. O m´etodo foi capaz de realizar 9.598 associac¸˜oes utilizando os parˆametros τs = 1000 metros e τt = 0, 2% pr´oximos textualmente. A Ta-bela 6 ilustra algumas as amostras de posic¸˜oes e os recursos associados a tais amostras. O tempo de execuc¸˜ao m´edio foi de 1,3 segundos para cada posic¸˜ao analisada, pois o prot´otipo desenvolvido executa uma consulta na Web a cada posic¸˜ao analisada buscando pelos recursos em uma colec¸˜ao de LOD. Pode-se diminuir o tempo m´edio de execuc¸˜ao com a execuc¸˜ao de buscas a recursos de LOD localmente, independendo de conex˜ao com a Internet.

(50)

48

Figura 17 – Distribuic¸˜ao de similaridade l´exica (recursos a 1024 metros de distˆancia)

4.2 DISCUSS ˜AO

Ap´os analise manual, percebemos relevantes associac¸˜oes estabeleci-das. Por exemplo, a Figura 18 ilustra uma amostra de dado sobre movimento (bal˜ao amarelo) associado a um recurso (bal˜ao azul). Nota-se que o recurso candidato n˜ao precisa necessariamente estar pr´oximo ao dado sobre movi-mento. A ligac¸˜ao ainda ´e verdadeira, pois o objeto m´ovel est´a distante para capturar a imagem do recurso ao qual foi associado. A associac¸˜ao ilustrada pela Figura 14 tamb´em foi realizada a um recurso com o aux´ılio da proximi-dade textual, mesmo estando tal recurso em uma regi˜ao densa de pontos de interesse.

As associac¸˜oes realizadas sugerem que informac¸˜oes espaciais e textu-ais s˜ao relevantes. No entanto, somente essas informac¸˜oes n˜ao s˜ao suficientes em todos os casos. Outras t´ecnicas (e.g., aprendizado de m´aquina, Entity

(51)

49

Tabela 6 – Vis˜ao textual dos experimentos Identificador

da postagem do Flickr

Tags da postagem URI do recurso R´otulos do recurso

50344933 riodejaneiro, corco-vado, brazil, brasil

lgd:/triplify/node1551149888 Corcovado

28567054 lovelyphotos, forteco-pacabana, forte, copa-cabana

lgd:/triplify/node2308298808 Forte de Co-pacabana

107131876 rio, jardim, janeiro, garden, de, coutinho, by, bothanical, cota-nico lgd:/triplify/node1613993266 Jardim Botˆanico 40774808 viradacultural, virada, teatromunicipal-des˜aopaulo, teatro-municipal, teatro, s˜aopaulo, s˜ao, paulo, municipal, cultural

lgd:/triplify/way46927931 Teatro Muni-cipal de S˜ao Paulo

72964391 pezinho, foot, copaca-bana, brazil, beach

lgd:/triplify/way179496798 Praia de Co-pacabana 37508938 voador, rio, janeiro,

dish, deep, de, circo

lgd:/triplify/node331382172 Circo Voador

Linking) e outras informac¸˜oes (e.g., informac¸˜oes temporais e de contexto) poderiam ser utilizadas para potencializar a qualidade das associac¸˜oes.

Ap´os os dados sobre movimentos estarem associados a recursos de LOD, os mesmos podem ser inseridos em um ontologia tal como a proposta em (FILETO et al., 2013) e realizar consultas como “Quais foram os objetos m´oveis que frequentaram um local tur´ıstico espec´ıfico?”ou “Quais foram os objetos m´oveis que frequentaram locais tur´ısticos em geral?”.

(52)

50

(53)

51

5 TRABALHOS RELACIONADOS

O problema de enriquecer semanticamente dados sobre movimento associando-os a LOD foi inicialmente definido em (FILETO et al., 2013). Tal trabalho apontou os benef´ıcios desta abordagem para o enriquecimento semˆantico de dados sobre movimento e a necessidade de desenvolver t´ecnicas eficazes e eficientes para efetuar tal associac¸˜ao.

Dados sobre movimento podem ser enriquecidos semanticamente uti-lizando informac¸˜oes espaciais (ALVARES et al., 2007). No entanto, a utilizac¸˜ao de atributos textuais ajudam a enriquecer dados sobre movimento que n˜ao possuem precis˜ao espacial ou est˜ao localizados em regi˜oes densas de recursos. A coleta de uma amostra de posic¸˜ao de um objeto m´ovel pode n˜ao ser precisa, prejudicando o enriquecimento semˆantico utilizando apenas informac¸˜oes espaciais.

Figura 19 – Exemplo de enriquecimento semˆantico, adaptado de (ALVARES et al., 2007)

Uma linha de pesquisa recente que ajuda na definic¸˜ao formal e soluc¸˜ao eficiente do problema aqui tratado prop˜oe maneiras de fazer a junc¸˜ao por si-milaridade entre bases de dados espaciais textualmente anotadas. (BALLES-TEROS; CARY; RISHE, 2011) prop˜oe o c´alculo para junc¸˜ao espac¸o-textual como sendo a raz˜ao entre proximidade textual (coeficiente de Jaccard) e espa-cial (distˆancia Ortodromia). (BOUROS; GE; MAMOULIS, 2012) e (LIU; LI; FENG, 2012) calculam as proximidades textuais independentemente e con-sideram similares elementos que possuem valores de proximidade espacial e textual superiores aos seus respectivos limiares.

Outra linha de pesquisa, conhecida por Entity Linking, consiste em detectar em um texto menc¸˜oes a entidades de uma base de conhecimento. Um recente trabalho que define o problema e prop˜oe sua soluc¸˜ao ´e

(54)

(CEC-52

CARELLI et al., 2013). No entanto, em tal trabalho n˜ao s˜ao consideradas as informac¸˜oes espac¸o-temporais (i.e., n˜ao consideram dados sobre movimento como uma fonte de dados de entrada para o problema).

A Tabela 7 sintetiza a comparac¸˜ao do m´etodo proposto e os diferen-tes trabalhos. O primeiro grupo, identificado pelo n´umero 1, utiliza t´ecnicas de proximidade espacial e textual combinadas para realizar a junc¸˜ao espac¸o-textual. O segundo grupo, identificado pelo n´umero 2, utiliza t´ecnicas de Entity Linking. O terceiro grupo, identificado pelo n´umero 3, enriquece se-manticamente dados sobre movimento utilizando apenas informac¸˜ao espacial. Nota-se que as t´ecnicas de junc¸˜ao por similaridade espac¸o-textual e Entity Linking, nestes casos, n˜ao s˜ao utilizadas para o enriquecimento semˆantico de dados sobre movimento.

Tabela 7 – Tabela comparando os trabalhos relacionados

Trabalho Proximidade espacial Comparac¸˜ao textual MD LOD Ballesteros et al. 20111 x x Bouros et al. 20121 x x Liu et al. 20121 x x Ceccarelli et al. 20132 x Alvares et al., 20073 x x May 2014 x x x x

O diferencial do trabalho, comparado a trabalhos relacionados, est´a na utilizac¸˜ao de t´ecnicas de junc¸˜ao por similaridade de bases de dados espaciais, textualmente anotadas, na an´alise de dados sobre movimento, identificando menc¸˜oes a entidades presentes em colec¸˜oes de LOD.

(55)

53

6 CONCLUS ˜AO E TRABALHOS FUTUROS

O enriquecimento semˆantico de dados sobre movimento ´e uma quest˜ao bastante discutida atualmente na literatura (PARENT et al., 2013)(YAN et al., 2013). O potencial do enriquecimento semˆantico utili-zando associac¸˜oes a colec¸˜oes de LOD merece atenc¸˜ao devido a estruturac¸˜ao com semˆantica bem definida que tais dados possuem. Este trabalho prop˜oe um m´etodo para realizar o enriquecimento semˆantico de dados sobre mo-vimento textualmente anotados atrav´es da associac¸˜ao a recursos proveni-entes de colec¸˜oes de LOD. Suas principais contribuic¸˜oes s˜ao: (i) crit´erios para filtragem e ranqueamento de recursos de LOD com dados sobre movi-mento, baseados na distˆancia espacial e proximidade textual entre anotac¸˜oes do movimento e atributos textuais de LOD usando a medida SoftTFIDF; (ii) implementac¸˜ao e teste do m´etodo proposto com dados sobre movimento re-ais obtidos de postagens em m´ıdia social e LOD; e (iii) documentac¸˜ao dos resultados obtidos nos artigos (MAY; FILETO, 2014) e (NABO et al., 2014). Os resultados obtidos mostram que a proposta ´e vi´avel e promissora, embora muitas pesquisas ainda sejam necess´arias para aprimorar e validar m´etodos de enriquecimento semˆantico de dados sobre movimento atrav´es da associac¸˜ao com recursos de colec¸˜oes de LOD.

Em trabalhos futuros planeja-se: (i) acr´escimo do filtro temporal para selecionar os recursos compat´ıveis temporalmente a posic¸˜ao; (ii) es-tender o m´etodo proposto com o uso de informac¸˜oes de contexto, similari-dade semˆantica, t´ecnicas de entity linking e aprendizado de m´aquina, para ranquear as associac¸˜oes candidatas identificadas pelo uso de proximidade espac¸o-temporal e textual de modo a obter resultados com melhor cober-tura e precis˜ao; (iii) analisar a qualidade dos resultados gerados pelo m´etodo proposto com diferentes colec¸˜oes de dados sobre movimento e LOD; (iv) estender o m´etodo proposto para determinar propriedades de associac¸˜oes re-alizadas (e.g., meio de transporte, local, evento); e (v) aprimorar o m´etodo proposto para execuc¸˜ao mais eficiente sem comprometer a qualidade dos re-sultados, usando algoritmos eficientes para junc¸˜ao espacial e por similaridade, entre outras possibilidades.

(56)
(57)

55

REFER ˆENCIAS

ALVARES, L. O. et al. A model for enriching trajectories with semantic geographical information. In: Proceedings of the 15th annual ACM international symposium on Advances in geographic information systems. New York, NY, USA: ACM, 2007. (GIS ’07), p. 22:1–22:8. ISBN 978-1-59593-914-2. Dispon´ıvel em:

<http://doi.acm.org/10.1145/1341012.1341041>.

ANGLES, R.; GUTIERREZ, C. The expressive power of sparql. In: International Semantic Web Conference. [S.l.: s.n.], 2008. p. 114–129. BALLESTEROS, J.; CARY, A.; RISHE, N. Spsjoin: Parallel spatial similarity joins. In: Proceedings of the 19th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems. New York, NY, USA: ACM, 2011. (GIS ’11), p. 481–484. ISBN 978-1-4503-1031-4. Dispon´ıvel em:

<http://doi.acm.org/10.1145/2093973.2094054>.

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web. Scientific American, v. 284, n. 5, p. 34–43, maio 2001. Dispon´ıvel em: <http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21>.

BOUROS, P.; GE, S.; MAMOULIS, N. Spatio-textual similarity joins. Proc. VLDB Endow., VLDB Endowment, v. 6, n. 1, p. 1–12, nov. 2012. ISSN 2150-8097. Dispon´ıvel em:

<http://dl.acm.org/citation.cfm?id=2428536.2428537>.

CECCARELLI, D. et al. Learning relatedness measures for entity linking. In: Proceedings of the 22Nd ACM International Conference on

Conference on Information & Knowledge Management. New York, NY, USA: ACM, 2013. (CIKM ’13), p. 139–148. ISBN 978-1-4503-2263-8. Dispon´ıvel em: <http://doi.acm.org/10.1145/2505515.2505711>. COHEN, W. W.; RAVIKUMAR, P.; FIENBERG, S. E. A comparison of string metrics for matching names and records. In: Proceedings of the KDD-2003 Workshop on Data. Washington, DC: [s.n.], 2003. p. 13–18. ISBN 3-540-29754-5.

FILETO, R. et al. Baquara: A holistic ontological framework for movement analysis using linked data. In: NG, W.; STOREY, V.; TRUJILLO, J. (Ed.).

(58)

56

Conceptual Modeling. Springer Berlin Heidelberg, 2013, (Lecture Notes in Computer Science, v. 8217). p. 342–355. ISBN 978-3-642-41923-2. Dispon´ıvel em: <http://dx.doi.org/10.1007/978-3-642-41924-9 28>. GRUBER, T. Ontology. 2007. To appear in the Encyclopedia of Database Systems, Ling Liu and M. Tamer ¨Ozsu (Eds.), Springer-Verlag, 2008. Dispon´ıvel em:

<http://tomgruber.org/writing/ontology-definition-2007.htm>. LIU, S.; LI, G.; FENG, J. Star-join: Spatio-textual similarity join. In: Proceedings of the 21st ACM International Conference on Information and Knowledge Management. New York, NY, USA: ACM, 2012. (CIKM ’12), p. 2194–2198. ISBN 978-1-4503-1156-4. Dispon´ıvel em:

<http://doi.acm.org/10.1145/2396761.2398600>.

MAY, C.; FILETO, R. Conectando dados de movimento textualmente anotados a dados ligados. In: ERBD 2014. [S.l.: s.n.], 2014.

MOUNTAIN, D.; RAPER, J. Modelling human spatio-temporal behaviour: a challenge for location-based services. GeoComputation, Brisbane, 2001. Dispon´ıvel em:

<http://www.geocomputation.org/2001/papers/mountain.pdf>. NABO, R. et al. Anotac¸˜ao de trajet´orias via fus˜ao com trilhas de m´ıdias sociais. In: ERBD 2014. [S.l.: s.n.], 2014.

PARENT, C. et al. Semantic trajectories modeling and analysis. ACM Comput. Surv., ACM, New York, NY, USA, v. 45, n. 4, p. 42:1–42:32, ago. 2013. ISSN 0360-0300. Dispon´ıvel em:

<http://doi.acm.org/10.1145/2501654.2501656>.

SACENTI, J.; FILETO, R. Linkmapia: Uma abordagem para converter dados geogr ˜A¡ficos coletados voluntariamente em dados ligados. In: ERBD 2014. [S.l.: s.n.], 2014.

SHETH, A. P. et al. (Ed.). The Semantic Web - ISWC 2008, 7th International Semantic Web Conference, ISWC 2008, Karlsruhe, Germany, October 26-30, 2008. Proceedings, v. 5318 de Lecture Notes in Computer Science, (Lecture Notes in Computer Science, v. 5318). [S.l.]: Springer, 2008. ISBN 978-3-540-88563-4.

YAN, Z. et al. Semantic trajectories: Mobility data computation and

annotation. ACM Trans. Intell. Syst. Technol., ACM, New York, NY, USA, v. 4, n. 3, p. 49:1–49:38, jul. 2013. ISSN 2157-6904. Dispon´ıvel em: <http://doi.acm.org/10.1145/2483669.2483682>.

Referências

Documentos relacionados

O ar que eventualmente escapa das canalizações ou outros elementos inadequadamente vedados, não polui o ambiente..  Esta limpeza é uma exigência, por exemplo nas

Nessa situação temos claramente a relação de tecnovívio apresentado por Dubatti (2012) operando, visto que nessa experiência ambos os atores tra- çam um diálogo que não se dá

São por demais conhecidas as dificuldades de se incorporar a Amazônia à dinâmica de desenvolvimento nacional, ora por culpa do modelo estabelecido, ora pela falta de tecnologia ou

Embora não haja prova definitiva, segundo conversação com o diretor do Museo de la Revolución Industrial, Mauro Delgrosso, existe uma suspeita de que a negociação da

presidenta passou a palavra ao relator Rogério da Silva Nunes, o qual procedeu à leitura

Para reverter essa situa~ão, o setor tel que se tornar aais eficiente e versátil no trata.ento dos recursos florestais.. Pelas suas características tecnológicas, as quais perlitel

Mesmo com genética de aptidão para corte inferior e peso inicial de entrada no confinamento também inferior, os animais utilizados no presente estudo

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam