Após a exposição da proposta de trabalho, dos conceitos envolvidos e dos resultados obtidos com a aplicação desenvolvida, esse capítulo apresenta as conclusões finais deste trabalho.

Foi proposto que, de forma a reduzir o tempo necessário para tratamento de problema de TI, a aplicação de técnicas de classificação de textos poderia melhorar o tempo gasto na atividade de encaminhamento dos chamados para o grupo mais indicado para seu atendimento. Nessa abordagem, os grupos de atendimento são vistos como categorias, e os relatórios de chamados cadastrados no sistema são os documentos atribuídos a essas categorias. Palavras que compõe os textos são os atributos dos documentos devem ser usados para sua classificação. Um novo processo de atendimento, que consiste em uma versão revisada do processo atual, foi apresentada para mostrar como a aplicação da classificação poderia facilitar o processo.

Um experimento foi realizado conforme as condições descritas e os resultados apresentados de forma tabular. Conforme relatado, a aplicação das técnicas de classificação de textos nos chamados, nas condições estudadas, possibilita que os chamados possam ser direcionados para seus grupos responsáveis de forma mais rápida do que o processo manual, que é utilizando nas estruturas de help desk das organizações e empresas hoje.

A aplicação desenvolvida aplicou o processo proposto num conjunto de chamados reais e os resultados obtidos indicam que, mesmo com uma taxa de erros razoável, os ganhos no tempo de atendimento são significativos.

O processo proposto apresentou resultados promissores, indicando que os textos são uma boa forma de encontrar semelhanças entre os chamados. Essa relação possibilita que outras informações sejam extraídas de uma base e atribuídas a um novo chamado. Essas informações podem incluir medidas de impacto que um problema pode causar, tanto em termos de indisponibilidade de sistema como em problemas nas regras de negócio, isso possibilitaria uma priorização especial no atendimento.

Outra idéia promissora seria encontrar propostas de soluções para o problema relatado em um chamado, consultando informações sobre como outros chamados semelhantes foram encerrados. O classificador poderia gerar uma lista de sugestões ou recomendações e propor para os analistas.

Foi percebido que diferentes técnicas de classificação, em combinação com diferentes seleções de atributos para classificação de cada nível podem obter resultados melhores. Dentre as alternativas testadas foi identificada qual a melhor combinação para cada nível da classificação seqüencial, juntamente com uma breve analise sobre os motivos que podem ter levado a combinação a ter os melhores resultados.

Por fim, conclui-se que os resultados desse trabalho habilitam os interessados em tornar os processos de atendimento mais ágeis, reduzindo os tempos de interrupção de serviços quem podem ser críticos para as organizações, reduzindo potenciais prejuízos para os negócios e aumentado a eficiência operacional.

Referências Bibliográficas

1. ANVIK, J, HIEW, L. MURPHY, G. C., Who should fix this bug? in ICSE 06: Proceeding of the 28th international conference on Software engineering, pp. 361- 370 (New York, NY, USA: ACM Press, 2006).

2. BARBOSA,Rodolfo e ALVES, Aluísio. Petrobras ultrapassa Microsoft em valor de mercado, diz estudo. São Paulo: Agência Reuters, 19/05/2008

3. BOSER. B, GUYON, I. e VAPNIK, V. - A Training Algorithm for Optimal Margin Classifiers, Proc. of the 5th Annual ACM Workshop on Computational Learning Theory, pp.144-152, ACM Press, 1992

4. CAMARGO, Y. B. L. Abordagem Lingüística na Classificação de Textos em Português. Dissertação de M.Sc. COPPE/UFRJ, Rio de Janeiro, RJ 2007

5. CARBONELL JG, MICHALSKI, RS; MITCHELL TM - Machine learning: An artificial intelligence approach, Morgan Kaufmann 1986. ISBN 0934613001

6. CHAKRABARTI S. Mining the Web: Discovering Knowledge from Hyper-text Data, Morgan Kaufmann, 2002

7. COVER, T.,HART, P., 1967, "Nearest neighbor pattern classification", Information Theory, IEEE Transactions on, v. 13, n. 1, pp. 21-27.

8. CUBRANIC, D. e MURPHY, G.C. – Automatic bug triage using text classification. In Proceedings of Software Engineering and Knowledge Engineering, pages 92-97, 2004.

9. DUMAIS, S., PLATT, J., HECKERMAN, D., e SAHAMI, M. 1998. Inductive learning algorithms and representations for text categorization. In Proceedings of the Seventh international Conference on information and Knowledge

Management (Bethesda, Maryland, United States, November 02 - 07, 1998). CIKM '98. ACM, New York, NY, 148-155.

10. EADS, D.R; HILL, D.; DAVIES, S.; PERKINS, S.J.;MA, J; PORTER, R.B. ; THEILER, J.P. - Genetic algorithms and support vector machines for time series classification, in: B. Bosacchi, D.B. Fogel, J.C. Bezdek (Eds.), Applications and Science of Neural Networks, Fuzzy Systems, and Evolutionary Computation V, Proceedings of the SPIE, vol. 4787, 2002, pp. 74–85.

11. EIBE, I. W.; WITTEN, I. H; FRANK, E.; TRIGG, L.; HALL, M.; HOLMES, G.; CUNNINGHAM, S.J.; Weka: Practical Machine Learning Tools and Techniques with Java Implementations. In:Proc ICONIP/ ANZIIS/ANNES99 Future Directions for Intelligent Systems and Information Sciences 1999.

12. FRIEDMAN, J.H. Flexible Metric Nearest Neighbour Classification - technical report, Stanford Univ., Nov. 1994.

13. FRIEDRICHS, F; IGEL C; Evolutionary tuning of multiple SVM parameters. Trends in Neurocomputing: 12th European Symposium on Artificial Neural Networks 2004. 2005

14. FURTADO, M. I. V., Inteligência Competitiva para o Ensino Superior Privado: uma Abordagem através da Mineração de Textos, Tese de D.Sc., COPPE/UFRJ, Rio de Janeiro, RJ, Brasil, 2004.

15. GARNER, S.R. 1995. WEKA: The Waikato Environment for Knowledge Analysis. In Proceedings of the New Zealand Computer Science Research Students Conference, pages 57–64.

16. HAN, J. e KAMBER, M - DataMining: Concepts and Techniques, Morgan Kaufmann, San Francisco, CA, 2001.

17. HASTIE, T e TIBSHIRANI,R - Discriminant Adaptive Nearest Neighbor

Classification, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 18, no. 6, pp. 607-616, June, 1996.

18. JENSEN, V. FINN. Bayesian Networks and Decision Graphs. Springer-Verlag. 2001.

19. JOACHIMS, T. Text Categorization with support vector machines: learning with many relevant features. In: Proceedings of the 10th European Conference on Software Engineering, p137-142. 1998

20. LEWIS, D., 1998, "Naive Bayes at forty: The independence assumption in information retrieval", pp. 4-15,Springer Verlag, Heidelberg, DE.

21. LOPES, M. C. S., Mineração de dados textuais utilizando técnicas de clustering, para o idioma português, Tese de D.Sc., COPPE/UFRJ, Rio de Janeiro, RJ, Brasil, 2004.

22. LOUREIRO, S. M., MARGOTO, L. R., VAREJÃO, F. M., et al., 2005, "Um mecanismo automático para busca de parâmetros de técnicas de classificação utilizando algoritmos genéticos". XXV Simpósio Brasileiro de Computação - SBC, V Encontro Nacional de Inteligência Artificial – ENIA

23. NEVES, M. L., 2001. PubsFinder - um Agente Inteligente para Busca e Classificação de Páginas de Publicações. Dissertação de M.Sc. Centro de Informática da UFPE, Recife.

24. PINHEIRO, A. C. L. - Ambiente Analítico e Qualidade de Informações: um estudo de caso da implantação do SAP BW na Petrobras. Dissertação de Mestrado. Pontifícia Universidade Católica do Rio de Janeiro. 2006.

25. PORTER, M.F. An algorithm for suffix stripping, Program 14 (1980)

26. REDMAN, T. The impact of poor data quality on the typical enterprise - Communications of the ACM, Volume 41, Issue 2 (February 1998)

27. RIZZI, C. B., WIVES, L. K., OLIVEIRA, J. P. M., ENGEL, P.M. , 2000, “Fazendo uso da Categorização de Textos em Atividades Empresariais”,

International Symposium on Knowledge Management/Document Management - ISKDM/DM 2000, pp. 251-268, Curitiba, Brasil.

28. ROBERTSON, S. E., 1997, "The probability ranking principle in IR", pp. 281- 286.http://portal.acm.org/citation.cfm?id=275701

29. RUSSELL, S; NORVIG - Artificial Intelligence: A Modern Approach. Prentice Hall, 1995.

30. SEBASTINANI, F. Machine learning in automated text categorization. ACM Comput. Surv. 34, 1 (Mar. 2002), 1-47.

31. SILVA, C. F., FAGUNDES, R., 2007, "Categorização de Textos da Língua Portuguesa com Árvores de Decisão, SVM e Informações Lingüísticas". XXVII Simpósio da Sociedade Brasileira de Computação, Rio de Janeiro, Brasil

32. WEILL, P., SUBRAMANI, M.R., e BROADBENT, M. "Building IT

Infrastructure for Strategic Agility," Sloan Management Review (44:1) 2002, pp 57-65.

33. WEISS, C, PREMRAJ, R, ZIMMERMANN, T. ZELLER, A. How Long Will It Take to Fix This Bug? in MSR 07: Proceedings of the Fourth International Workshop on Mining Software Repositories (Washington, DC, USA: IEEE Computer Society, 2007).

34. YANG, Y. and LIU, X. A re-examination of text categorization methods. In Proceedings of the ACM SIGIR Conference on Research and Development in Information Retrieval, 1999.

35. ZHANG, H., BERG, A. C., MAIRE, M e MALIK, J. - SVM-KNN:

Discriminative Nearest Neighbor Classification for Visual Category Recognition. In Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition - Volume 2 (June 17 - 22, 2006). CVPR. IEEE Computer Society, Washington, DC, USA

No documento Publicações do PESC Classificação de Texto para Melhoria no Atendimento de Help Desk (páginas 66-74)