• Nenhum resultado encontrado

Este trabalho avaliou uma coleção de documentos corporativos e um conjunto de consultas de seus usuários para identificar características comuns a ambos. Oito categorias fundamentais foram propostas e verificadas como características comuns a documentos e consultas, e a distribuição de assuntos entre as categorias apresentou alta correlação positiva. Essas categorias têm o potencial de tornarem-se facetas de uma classificação facetada para a informação corporativa. Isso sugere um caminho para a organização e representação do conhecimento e da informação corporativa que não foi identificado na literatura.

As oito categorias constituem possivelmente um modelo de longo prazo que requer revisões menos frequentes e suporta o desenvolvimento incremental de sistemas de recuperação de informação mais eficientes. O modelo facetado beneficia-se da análise facetada para o reconhecimento de características úteis da informação corporativa, em uma empresa ou em todo o domínio corporativo, algo essencial para o desenvolvimento de produtos de informação generalistas ou especializados.

Os resultados desta pesquisa podem ser comparados facilmente com pesquisas realizadas com dados de outras empresas, sem que os dados sejam muito expostos. O método facetado mostrou-se adequado para esse objetivo ao comparar assuntos e categorias de assuntos de mais alto nível, ao invés de termos e classificações que exponham potencial informação. Adicionalmente, este trabalho constitui um exemplo de classificação facetada mais distante daqueles encontrados na literatura, o que, para Wild et al. (2009) e La Barre (2010), é necessário para validar a própria análise facetada fora do seu contexto original.

Até onde sabemos, este é o primeiro trabalho que tenta estabelecer facetas comuns da informação corporativa no conteúdo de documentos e nas consultas de usuários. Portanto, as conclusões são preliminares e requerem amostras e resultados adicionais para que possam ser generalizadas. São igualmente importantes amostras de novos grupos de usuários, cenários adicionais de trabalho e tomadas de decisão, assim como também exemplos de outras empresas. Em todos os casos de novas amostras, as diferenças em tarefas, terminologia, conhecimento prévio sobre a coleção, formação acadêmica, atividade econômica da empresa e idioma devem ser especialmente investigadas, pois são as variáveis com maior potencial de influência sobre as categorias que foram descartadas neste trabalho.

Os efeitos deste modelo facetado em métodos automáticos é outra direção importante de trabalho futuro. A literatura apresenta algoritmos especiais para facetas especiais, tais como algoritmos sociais, espaciais e temporais. Porém, a combinação desses algoritmos em um único e integrado arcabouço é abordada apenas superficialmente devido a concorrência

comercial e ao sigilo industrial, especialmente na área de Ciência da Computação. Portanto, processos automáticos sobre informação corporativa carecem de uma maior base teórica e prática, sendo bons candidatos a objeto de estudo pela Ciência da Informação.

Ainda, coleções de referência são frequentemente adotadas para realizar esses estudos. Apesar de pertinentes para muitos trabalhos que dependam de experimentação, as coleções apresentam sérias limitações à variedade de situações que devem ser estudadas. Este trabalho abre uma última direção de trabalho futuro ao colocar à disposição sua coleção de documentos em língua portuguesa. A coleção pode ser obtida através da Internet e usada sem custos exclusivamente em pesquisa científica.

Espera-se que este trabalho sirva como um guia metodológico para o propósito de uma análise de domínio corporativo. Ao mesmo tempo, caso as categorias propostas se provem perspectivas utilitárias para um número maior de usuários em situações mais diversas, acredita-se também que seus resultados derivados deem suporte ao aperfeiçoamento de métodos automáticos de indexação, classificação e ranking.

REFERÊNCIAS

ABEL, F. et al. Leveraging the semantics of tweets for adaptive faceted search on twitter. In: AROYO, L. et al. (Ed.). 10th International Conference on the Semantic Web. 10., 2011, Proceedings... Heidelberg: Springer, 2011. p.1-17.

ALBRECHTSEN, H. Subject analysis and indexing: from automated indexing to domain analysis. Indexer, v.18, p.219–219, 1993.

ALVES, L. L.; DAVIS JR, C. A. Interoperability through Web Services: Evaluating OGC Standards in Client Development for Spatial Data Infrastructures. In: Brazilian Symposium on GeoInformatics, 8., 2006. Proceedings... São José dos Campos: INPE, 2006.

ALWIS, S. M. G. de; HIGGINS, S. E. Information as a tool for management decision making: a case study of Singapore. Information Research, v.7, n.1, paper 114, 2001. AUER, S. et al. Linked geodata: Adding a spatial dimension to the web of data. In:

International Semantic Web Conference, 8., 2009. Proceedings... Heidelberg: Springer, 2009. p.731–746.

BAILEY, P. et al. The CSIRO enterprise search test collection. SIGIR Forum, v.41, n.2, p.42–45, 2007.

BORGES, K. A. V. et al. Discovering geographic locations in web pages using urban addresses. In: 4th ACM workshop on Geographical information retrieval, 4., 2007. Proceedings... New York: ACM, 2007. p. 31–36.

BROUGHTON, V. The need for a faceted classification as the basis of all methods of information retrieval. Aslib Proceedings, v. 58, n.1/2, p.49–72, 2006.

BUKOWSKA, E. et al. Ontology-based retrieval of experts: The issue of efficiency and scalability within the extraspec system. In: QUIRCHMAYR, G. et al. (Ed.).

Multidisciplinary Research and Practice for Information Systems. Heidelberg: Springer, 2012. p.272–286.

CAMPOS, R. et al. What is the temporal value of web snippets? In: 1st International Temporal Web Analytics Workshop, 1., 2011. Proceedings... Hyderabad, India: CEUR, 2011.

CARDOSO, N.; SANTOS, D. To separate or not to separate? Reflections about current GIR practice. In: Workshop on Novel Methodologies for Evaluation in Information Retrieval, 1., 2008, Glasgow. Proceedings... Glasgow, NMEI, 2008.

CHOO, C. W. et al. Information culture and information use: an exploratory study of three organizations. Journal of the American Society for Information Science and Technology, v.59, n.5, p.792–804, 2008.

DAVIS Jr. et al. Inferring the Location of Twitter Messages Based on User Relationships, Transactions in Geographic Information Systems, v.15, p. 735-751, 2011.

DAVIS Jr., C. A.; ALVES, L. L. Web Services, Geospatial. In: SHEKHAR, S.; XIONG, H. Encyclopedia of GIS. Berlin: Springer, 2007.

DOLBY, J. et al. Extracting enterprise vocabularies using linked open data. In: International Semantic Web Conference, 8., 2009. Proceedings... Heidelberg: Springer, 2009. p.779–794. GARDIN, J.-C. Document analysis and linguistic theory. Journal of Documentation, v.29, n.2, p.137–168, 1973.

GARFIELD, E. A tribute to SR Ranganathan, the father of indian library science. Current Contents, v.6, p.37-44, 1984.

GIESS, M. et al. The generation of faceted classification schemes for use in the organisation of engineering design documents. International Journal of Information Management, v.28, n.5, p.379–390, 2008.

GIRGENSOHN, A. et al. Docubrowse: faceted searching, browsing, and recommendations in an enterprise context. In: 15th international conference on Intelligent user interfaces, 15., 2010. Proceedings... New York: ACM, 2010. p. 189–198.

GOPINATH, M. Ranganathan’s theory of facet analysis and knowledge representation. DESIDOC Journal of Library & Information Technology, v. 12, n. 5, p. 16-20, 1992. GUY, I. et al. Best faces forward: a large-scale study of people search in the enterprise. In: Conference on Human Factors in Computing Systems. 30., 2012. Proceedings... New York: ACM, 2012. p.1775–1784.

HALEVY, A. Y. et al. Enterprise information integration: successes, challenges and controversies. In: International Conference on Management of Data, 31., 2005, Baltimore. Proceedings... New York, ACM, 2005. p.778–787.

HJØRLAND, B. Domain analysis in information science: eleven approaches–traditional as well as innovative. Journal of documentation, v. 58, n. 4, p. 422–462, 2002.

HJØRLAND, B. Facet analysis: the logical approach to knowledge organization, Information Processing & Management, v.49, n.2, p. 545-557, 2012.

HONG, M. Potential usage of faceted classification in internet information retrieval. Interdisciplinary information sciences, Tohoku University, v. 12, n. 1, p. 43–51, 2006. JONES, R.; HASSAN, A.; DIAZ, F. Geographic features in web search retrieval. In: JONES, C.; PURVES,R.(Ed.). 2nd International Workshop on Geographic Information Retrieval, 2., 2008. Proceedings... New York: ACM, 2008. p.57–58.

LA BARRE, K. Facet analysis. Annual Review of Information Science and Technology, v. 44, n. 1, p. 243–284, 2010.

LIU, X. et al. Entity centric query expansion for enterprise search. In: 21st ACM International Conference on Information and Knowledge Management, 21., 2012. Proceedings... New York: ACM, 2012. p.1955–1959.

LIU, X. et al. Finding relevant information of certain types from enterprise data. In: 20th ACM international conference on Information and knowledge management, 20., 2011. Proceedings... New York, ACM, 2011. p. 47-56.

LYKKE-NIELSEN, M. Domain analysis, an important part of thesaurus construction. Advances in Classification Research Online, v.11, n.1, p.9–50, 2011.

MARCELLA, R.; ILLINGWORTH, L. The impact of information behaviour on small business failure. Information Research, v.17, n.3, paper 525, 2012.

NUNES, M. B. et al. Knowledge management issues in knowledge-intensive SMEs. Journal of Documentation, v. 62, n. 1, p. 101–119, 2006.

O’FARRILL, R. T. Information literacy and knowledge management at work: Conceptions of effective information use at nhs24. Journal of Documentation, v.66, n.5, p.706–733, 2010. OREN, E. et al. Extending faceted navigation for rdf data. In: International Web Semantic Conference, 5., 2006, Atenas. Proceedings... Heidelberg: Springer, 2006. p.559–572. OVERELL, S. Geographic Information Retrieval: Classification, Disambiguation and Modelling. 2009. 181 p. Tese (Doutorado em Computação) - Imperial College, London, 2009. RANGANATHAN, S. R. Prolegomena to Library Classification. New York: Asia

Publishing House, 1967.

RULA, A. et al. On the diversity and availability of temporal information in linked open data. In: International Web Semantic Conference, 11., 2012, Boston. Proceedings... Heidelberg: Springer, 2012. p.492–507.

SACCO, G. M. Some research results in dynamic taxonomy and faceted search systems. In: 18th International Workshop on Database and Expert Systems Applications, 18., 2007. Proceedings... New York, 2006. p.201-206.

SOLOMON, P. Bringing people, technology, and systems together through classification research: Designing, for change, learning, and maintenance. Advances in Classification Research Online, v.13, n.1, p.23–28, 2002.

SPINK, A. et al. Searching the web: The public and their queries. Journal of the American society for information science and technology, v.52, n.3, p.226-234, 2001.

SPITERI, L. A simplified model for facet analysis. Canadian journal of information and library science, v.23, p.1-30, 1998.

VAKKARI, P.; JÄRVELIN, K. Explanation in information seeking and retrieval. In: SPINK, Amanda; COLE, Charles (Ed.). New directions in cognitive information retrieval.

Heidelberg: Springer, 2005. p.113–138.

VICKERY, B. Faceted classification for the web. Axiomathes, Springer, v. 18, n. 2, p. 145– 160, 2008.

WANG, Z. et al. Using classification schemes and thesauri to build an organizational taxonomy for organizing content and aiding navigation, Journal of Documentation, v.64, n.6, p. 842-876, 2008.

WILD, P. J. et al. Describing engineering documents with faceted approaches: observations and reflections. Journal of Documentation, v.65, n.3, p.420–445, 2009.

WU, M. et al. Cost and benefit estimation of experts' mediation in an enterprise search. Journal of the Association for Information Science and Technology, v.65, n.1, p.146-163, 2014.

ÍCONE, ÍNDICE E SÍMBOLO, FUNDAMENTOS PARA LER E ORGANIZAR A