• Nenhum resultado encontrado

6. CONCLUSÕES E TRABALHOS FUTUROS

6.2 T RABALHOS F UTUROS

A seguir são apresentadas algumas direções que podem ser exploradas em trabalhos futuros: Expansão dos critérios de QI: Zaveri et al. (2012) sugerem 26 métricas para avaliação da qualidade em linked datasets. Algumas são irrelevantes no contexto de aplicações Linked Data para um domínio específico, porém, outras métricas ainda podem ser utilizadas (Mendes et al., 2012; Buil-Aranda et al., 2013; Zaveri et al., 2013). Um exemplo de métrica para o critério performance é a fornecido por Buil-Aranda et al. (2013). Esta métrica utiliza uma verificação por meio de consultas que, a partir de seu resultado, é gerado o escore da métrica. Este tipo de métrica é diferente de todas as métricas apresentadas na pesquisa de Zaveri et al. (2012).

Formalização do repositório de critérios e métricas: As métricas propostas nesta dissertação não foram padronizadas utilizando alguma linguagem. Em algumas métricas os numeradores e denominadores são calculados por meio do tamanho de um conjunto de respostas, como também, para a categoria da completude, as métricas são formadas dinamicamente, ou seja, de acordo com as consultas que o especialista no domínio disponibiliza. A padronização da descrição das métricas por meio de alguma linguagem é uma indicação de trabalho futuro. Isso habilitaria a implementação de mais métricas por critérios no repositório, como também permitiria uma possível escolha de qual métrica utilizar por critério.

Extensão da categoria de interlinking: Atualmente esta categoria possui apenas um critério de QI de nome igual. A métrica proposta identifica apenas as triplas que contém predicados de interlinking. Ou seja, é mensurado apenas um interlinking “explícito”. O interlinking também ocorre (implicitamente) quando sujeito e objeto possuem namespaces diferentes, independente de existir um predicado de interlinking na tripla. Apesar da API Jena disponibilizar uma função de identificação do namespace de um recurso (afn:namespace), não foi possível executar corretamente uma consulta que retornasse todas estas triplas por meio do endpoint. Assim, um possível trabalho futuro é a criação de uma métrica para mensurar o interlinking “implícito” de um linked dataset por meio de seu endpoint.

Utilização de outros métodos para geração da medida de qualidade: o método de decisão por múltiplos atributos utilizado na geração da medida de qualidade na abordagem é o SAW. Contudo, a partir dos múltiplos escores encontrados, outros métodos de decisão por múltiplos atributos podem ser utilizados para gerar a medida única de qualidade. Assim, um trabalho

futuro é a comparação entre os resultados da medida de qualidade que foi gerada utilizando diversos métodos. Além disso, a ferramenta pode ser melhorada para permitir ao ED a escolha de qual método de decisão por múltiplos atributos deve ser utilizado para gerar a medida única de qualidade.

R

EFERÊNCIAS

ASSAF, A.; SENART, A. Data Quality Principles in the Semantic Web. In: Proceedings of the 2012 IEEE Sixth international Conference on Semantic Computing (Sep. 19 - 21, 2012).

IEEE Computer Society, Washington, DC, 226-229. Disponível em:

<http://dx.doi.org/10.1109/ICSC.2012.39>.

ASSAF, A. et al. Improving Schema Matching with Linked Data. In: Proceedings of the 1st International Workshop on Open Data (WOD). May. 25, 2012. Nantes, França.

BATISTA, M. C. Otimização de Acesso em um Sistema de Integração de Dados através do uso de Caching e Materialização de Dados. Dissertação (Mestrado), Universidade Federal de Pernambuco (UFPE). Recife, PE. Brasil.

BATISTA, M. C. M. Schema Quality Analysis in a Data Integration System. Tese (Doutorado), Universidade Federal de Pernambuco (UFPE). Recife, PE. Brasil, 2008.

BERNERS-LEE, T. Linked Data - Design Issues. Disponível em:

<http://www.w3.org/DesignIssues/LinkedData.html>. Acesso em 09 de Dezembro de 2013. BIZER, C. Quality-Driven Information Filtering in the Context of Web-Based Information Systems. Tese (Doutorado), Freie Universität Berlin, 2007.

BIZER C.; CYGANIAK, R.; HEATH, T. How to Publish Linked Data on the Web. Disponível em: <http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/LinkedData Tutorial/>. Acesso em Novembro de 2013.

BIZER, C., HEATH, T.; BERNERS-LEE, T. Linked Data - The Story So Far. 2009. 1–22 p. Disponível em: <http://dx.doi.org/10.4018/jswis.2009081901>.

BIZER, C. et al. DBpedia – A Crystallization Point for the Web of Data. In: Proceedings of the Web Semantics: Science, Services and Agents on the World Wide Web, doi:10.1016/j.websem.2009.07.002.

BORST, W. Construction of Engineering Ontologies for Knowledge Sharing and Reuse. Tese (Doutorado), University of Twente, 1997.

BUIL-ARANDA, C.; HOGAN, A.; UMBRICH, J.; VANDENBUSSCHE, P. SPARQL Web- Querying Infrastructure: Ready for Action? In: Proceedings of the 12th International Semantic Web Conference (ISWC 2013). Sydney, Australia, Oct. 2013.

COLETTA, R. et al. Public Data Integration with WebSmatch. In: Proceedings of the 1st International Workshop on Open Data (WOD). Nantes, França. May, 25, 2012.

CUNHA, D. R. B.; SOUZA, D. Y.; LÓSCIO, B. F. Linked Data: da Web de Documentos para a Web de Dados. In: V Escola Regional de Informática Ceará, Maranhão, Piauí: Livro texto dos minicursos, 07 e 08 de novembro de 2011. ISBN 978-85-7669-258-4.

CYGANIAK, R.; JENTZSCH, A. The Linking Open Data cloud diagram. Disponível em <http://lod-cloud.net/>. Acesso em Maio de 2014.

FÜRBER, C.; HEPP, M. SWIQA – A Semantic Web Information Quality Assessment Framework. In: Proceedings of the 19th European Conference on Information Systems (ECIS 2011), Helsinki, Finland.

GRUBER, T. Toward principles for the design of ontologies used for knowledge sharing. International Journal Human-Computer Studies Vol. 43, Issues 5-6, Nov. 1995, p.907-928. HARTH, A.; SPEISER, S. On Completeness Classes for Query Evaluation on Linked Data. In: Proceedings of the 26th AAAI Conference (AAAI-12), Jul. 22–26, 2012, Toronto, Canada.

HARTIG, O.; LANGEGGER A. A Database Perspective on Consuming Linked Data on the Web. In: Proceedings of the Datenbank-Spektrum. Oct., 10(2), 2010.

HEATH, T.; BIZER, C. Linked Data: Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool, 2011.

LÓSCIO, B. F. et al. Using Information Quality for the Identification of Relevant Web Data Sources: A Proposal. In: Proceedings of the 14th International Conference on Information Integration and Web-based Applications & Services (iiWAS 2012). Dec. 3-5, 2012. Bali, Indonesia.

LÓSCIO, B. F.; FILHO, F. W. B. H. Web Semântica: Conceitos e Tecnologias. In: Proceedings of II Escola Regional de Computação (Ceará, Maranhão e Piauí) – ERCEMAPI, 2009.

MANOLA, F.; MILLER, E. RDF Primer. Disponível em <http://www.w3.org/ TR/rdf- primer/>. Acesso em Novembro de 2013.

MENDES, P.; MÜHLEISEN, H.; BIZER, C. Sieve: Linked Data Quality Assessment and Fusion, In: Proceedings of 2nd International Workshop on Linked Web Data Management (LWDM 2012) at the 15th International Conference on Extending Database Technology (EDBT 2012), Berlin, Mar. 2012.

NAUMMAN F.; FREYTAG, J. F.; SPILIOPOULOU, M. Quality-driven source selection using Data Envelopment Analysis. In: Proceedings of the 3rd Conference on Information Quality (IQ), Cambridge, MA.

NAUMMAN F. Data Fusion and Data Quality. In: Proceedings of the New Techniques and Technologies for Statistics Seminar (NTTS’98). Sorrent, Italy.

NAUMMAN, F.; ROLKER, C. Assessment Methods for Information Quality Criteria. In: Proceedings of the Conference on International Quality (IQ00) Boston.

NAUMMAN F. Quality-Driven Query Answering for Integrated Information Systems. LNCS 2261, Springer, Berlin, Heidelberg, New York, 2002.

OLIVEIRA, H., R. Explorando o Feedback do Usuário para Classificação de Fontes de Dados em Sistemas de Integração Pay-as-you-go. Dissertação (Mestrado), Universidade Federal de Pernambuco (UFPE). Recife, PE. Brasil, 2012.

PÉREZ, J.; ARENAS, M.; GUTIERREZ, C. Semantics of SPARQL. Technical Report TR/DCC-2006-17, Department of Computer Science, Universidad de Chile, 2006.

PIPINO, L. et al. Developing Measurement Scales for Data-Quality Dimensions. Volume 1 in Advances in Management Information Systems series, Vladimir Zwass editor, M.E. Sharpe, New York, 2005.

PRUD’HOMMEAUX, E.; BUIL-ARANDA, C. SPARQL 1.1 Federated Query. Disponível em <http://www.w3.org/TR/sparql11-federated-query/>. Acesso em Dezembro de 2013. SOMMERVILLE, I. Engenharia de Software. 9ª ed. Editora Pearson. Education – Br, 2011. SOUZA, D. Using Semantics to Enhance Query Reformulation in Dynamic Distributed Environments. Tese (Doutorado), Universidade Federal de Pernambuco (UFPE), Recife, PE, Brasil, 2009.

WANG, R. Y.; STRONG, D. M. Beyond accuracy: What data quality means to data consumers. Journal of Management Information Systems 12:4, 5–34, 1996.

WEIKUM, G. Towards Guaranteed Quality and Dependability of Information Services. In: Proceedings of the 8th German Conference on Database Systems in Office, Engineering, and Scientific Applications, Freiburg, Germany, pp. 379-409, 1999.

ZAVERI, A. et al. Quality Assessment Methodologies for Linked Open Data. Under review, http://www.semantic-web-journal.net/content/quality-assessment-methodologies- linked-open-data, 2012.

ZAVERI, A. et al. User-driven Quality Evaluation of DBpedia. In: Proceedings of 9th International Conference on Semantic Systems, I-SEMANTICS '13, Graz, Austria, 2013. ZHU, Y.; BUCHMANN, A. Evaluating and Selecting Web Sources as External Information Resources of a Data Warehouse. In: Proceedings of the 3rd International Conference on Web Information Systems Engineering (WISE’ 2002), Singapore, 2002.

A

PÊNDICE

A–E

NDPOINTS E

C

LASSIFICAÇÃO

M

ANUAL POR

C

ONSULTA

Documentos relacionados