• Nenhum resultado encontrado

5. Experimentos e Resultados

6.2. Trabalhos Futuros

Este trabalho deixa em aberto diversas extensões, que podem ser implementadas de modo a melhorar o trabalho aqui relatado. Dentre essas propostas, podemos citar:

1. Classificação de Subjetividade: o próximo passo para oferecermos um sis- tema de AS completo e mais autônomo é a construção do módulo de Análise de Subjetividade, responsável por separar os textos opinativos dos textos ob- jetivos.

2. A utilização de um corretor ortográfico: A ocorrência de erros de portu- guês é comum, principalmente em fóruns e redes sociais. A ocorrência des- ses erros é um dos muitos problemas enfrentados pelo nosso sistema e na AS em geral. Um corretor ortográfico iria auxiliar a melhorar as taxas de preci- são do nosso processo de classificação.

3. Combinação de POS-Taggers: como dito, o Stanford POS-Tagger obteve os melhores resultados nos testes que realizamos. Contudo, esse tagger ainda apresenta erros na determinação das classes gramaticais, o que influencia ne- gativamente a precisão das etapas de Extração e Classificação. A combina- ção de POS-Taggers poderá melhorar a determinação da classe gramatical das palavras, e consequentemente, possibilitar uma melhora nas taxas de precisão dessas duas etapas da AS.

4. Agrupamento de Pares Sinônimos: pares sinônimos podem ser considera- dos um único par, melhorando a precisão do sistema.

5. Resolução de correferência: identificação automática da característica que está sendo referenciada por um pronome, a fim de melhorar a cobertura do sistema.

6. Módulo de Indexação de Conteúdo: O desenvolvimento desse módulo tor- naria o passo Filtro de Polaridade, da etapa de classificação (ver seção

73 4.4.2), independente de um engenho de busca, e com melhores resultados, caso esse módulo indexe apenas conteúdos dos textos opinativos.

74

ReferênciasBibliográficas

[ALLEN, 1995] Allen, J. Natural Language Understanding, 2nd ed., California: The Benjamin/Cummings Publishing Company, Inc., 1995.

[AUE & GAMON, 2005] Aue, A.; Gamon, M. Customizing Sentiment Classifiers to New Domains: A Case Study. In: Proceedings of Recent Advances in Natural Lan-

guage Processing (RANLP). 2005. Disponível em:

http://research.microsoft.com/apps/pubs/default.aspx?id=65430. Último Acesso em 17 dez. 2012.

[BADER et al., 2011] Bader, B.; Kegelmeyer, W.; Chew, P. Multilingual Sentiment Analysis Using Latent Semantic Indexing and Machine Learning. In: Data Mining Workshops (ICDMW), 2011 IEEE 11th International Conference, p. 45-52,Vancouver, Canada. 2011.

[BAEZA-YATES & RIBEIRO-NETO, 1999] Baeza-Yates, R.; Ribeiro-Neto. Modern Information Retrieval. Addison Wesley-ACM Press. New York, EUA. 1999.

[BLITZER et al., 2007] Blitzer, J.; Dredze, M.; Pereira, F. Biographies, Bollywood, Boom-boxes and Blenders: Domain Adaptation for Sentiment Classification. In: Computational Linguistics. Association for Computational Linguistics, p.440-447. 2007.

[BOIY & MOENS, 2009] Boiy, E.; Moens, M. A machine learning approach to sen- timent analysis in multilingual Web texts. In: Journal Information Retrieval, v.12, Issue 5, p. 526-558, Hingham, MA, USA. 2009.

[BOSER et al., 1992] Boser, E.; Guyon, I.; Vapnik, V. A training algorithm for opti- mum margin classifiers. In: Fifth Annual Workshop on Computational Learning Theo- ry, ACM, p. 144-152, New York, NY, USA. 1992.

[BRECK et al., 2007] Breck, E.; Choi, Y.; Cardie, C.: Identifying expressions of opin- ion in context. In: IJCAI’07: Proceedings of the 20th international joint conference on Artifical intelligence, p. 2683–2688, San Francisco, CA, USA, 2007.

[CARDOSO, 2000] CARDOSO, P. Recuperação de Informação. In: INFOCOMP Revista de Computação da UFLA, Lavras, v.1, 2000. Disponível em:http://www.dcc.ufla.br/infocomp/artigos/v2.1/art07.pdf. Acesso em 13 dez. 2012. [CARRILHO & PASSOS, 2007] Carrilho, J.; Passos, E. Desenvolvimento de uma Metodologia para Mineração de Textos. Dissertação de Mestrado– Departamento de Engenharia Elétrica, Pontifícia Universidade Católica do Rio de Janeiro. Rio de Janeiro.

2007.Disponível em: http://www.maxwell.lambda.ele.puc-

75 [CARVALHO et al., 2009] Carvalho, P.; Sarmento, L.; Silva, M.; Oliveira, E. Clues for detecting irony in user-generated contents: oh...!!it's "so easy" ;-). In: TSA '09 Pro- ceeding of the 1st international CIKM workshop on Topic-sentiment analysis for mass opinion. New York - USA, p.53-56. 2009.

[CASTRO, 2011] Castro, A. Detecção Automática de Subjetividade: Aprendizagem de Máquina Versus Ferramentas Linguísticas. Trabalho de Graduação em Ciência da Computação – Centro de Informática/UFPE, Recife. 2011.

[CILIBRASI & VITÁNYI, 2007] Cilibrasi, R.; Vitányi, P. The Google Similarity Dis- tance. In: IEEE Transactions on Knowledge and Data Engineering, v.19, Issue 3, p. 370-383, NJ, USA. 2007.

[COVER & THOMAS, 1991] Cover, T.; Thomas, J. Elements of information theory. Wiley-Interscience, 2nd Edition, New York, NY, USA, 1991.

[DAS & BANDYOPADHYAY, 2009] Das, A.; Bandyopadhyay, S. Subjectivity De- tection in English and Bengali: A CRF-based Approach. In: Proceeding of ICON. 2009. Disponível em: http://www.amitavadas.com/Pub/ICON_Final_Amitava.pdf. Acesso em 13 dez. 2012.

[DENECKE, 2008] Denecke, K. Using SentiWordNet for multilingual sentiment analysis. In: Data Engineering Workshop, 2008. ICDEW 2008. IEEE 24th Internation- al Conference, p. 507-512. 2008.

[DENECKE, 2009] Denecke, K. Are SentiWordNet scores suited for multi-domain sentiment classification? In: Proceedings of the 4th International Conference on Digi- tal Information Management (ICDIM), p.33-38. 2009.

[DING et al., 2008] DING, X.; LIU, B.; YU, P. A holistic lexicon-based approach to opinion mining. In: WSDM ’08: Proceedings of the international conference on Web search and web data mining, p.231–240, New York, NY, USA. 2008.

[DUTTON & CONROY, 1997] Dutton D.; Conroy, G.: A review of machine learning. In: The Knowledge Engineering Review, v.12, Issue 4, p.341–367, New York, NY, USA. 1997.

[ESULI & SEBASTIANI, 2006] Esuli, A.; Sebastiani, F. Sentiwordnet: a publicly available lexical resource for opinion mining. In: Proceedings of the 5th conference on language resources and evaluation, p.417-422. Genoa - Italy. 2006.

[FAHRNI & KLENNER, 2008] Fahrni, A.; Klenner, M. Old wine or warm beer: tar- get-specific sentiment analysis of adjectives. In: Symposium on Affective Language in Human and Machine, AISB 2008 Convention, p. 60-63, Aberdeen, Scotland. 2008.

76 [FERNANDES, 2010] FERNANDES, F. Um Framework para Análise de Sentimen- to em Comentários sobre Produtos em Redes Sociais. Dissertação (Mestrado em Ci- ência da Computação) - Centro de Informática/UFPE. Recife. 2010.

[HATZIVASSILOGLOU & MCKEOWN, 1997] Hatzivassiloglou, V.; McKeown, K. Predicting the semantic orientation of adjectives. In: Proceedings of the Joint ACL/EACL Conference, p. 174–181, Stroudsburg, PA, USA. 1997.

[HATZIVASSILOGLOU & WIEBE, 2000] Hatzivassiloglou, V.; Wiebe, J. Effects of adjective orientation and gradability on sentence subjectivity. In: Proceedings of the 18th conference on Computational linguistics, Saarbrücken-Germany, p.299-305. 2000. [HEARST, 1992] Hearst, M. Direction-Based Text Interpretation as an Information Access Refinement. In: Text-Based Intelligent Systems, Paul Jacobs (Ed.), Lawrence Erlbaum, p.257-274. 1992.

[HSU et al., 2010] Hsu, R.; See, B.; Wu, A. Machine Learning for Sentiment Analy- sis on the Experience Project. In: CS 229 Machine Learning Final Projects, Autumn. 2010. Disponível em: http://cs229.stanford.edu/proj2010/HsuSeeWu- MachineLearningForSentimentAnalysis.pdf. Acesso em 13 dez. 2012.

[HU & LIU, 2004] Hu, M.; Liu, B. Mining opinion features in customer reviews. In: AAAI’04: Proceedings of the 19th national conference on Artifical intelligence, AAAI Press, p.755–760. 2004.

[IPNEWS, 2010] IPNEWS: As 10 tecnologias estratégicas para 2011. 2010. Disponí- vel em: http://www.ipnews.com.br/voip/pesquisas/pesquisas/as-10-tecnologias-estrat- gicas-para-2011.html. Acesso em: 10 dez. 2010.

[JIANG & ZHAI, 2006] Jiang, J.; Zhai, C. Exploiting Domain Structure for Named Entity Recognition. In: HLT-NAACL '06 Proceedings of the main conference on Hu- man Language Technology Conference of the North American Chapter of the Associa- tion of Computational Linguistics, p.74-81, Stroudsburg, PA, USA. 2006.

[JIANG & ZHAI, 2007] Jiang, J.; Zhai, C. Instance Weighting for Domain Adapta- tion. In: NLP. Proceedings of the 45th Annual Meeting of the Association of Computa- tional Linguistics, p.264-271. 2007.

[JIN & HO, 2009] Jin, W.; Ho, H.A novel lexicalized hmm-based learning frame- work for web opinion mining. In: ICML ’09: Proceedings of the 26th Annual Interna- tional Conference on Machine Learning, p.465–472, ACM. New York, NY, USA. 2009. [KOSAL & BLOCKEEL, 2000] Kosal, R.; Blockeel, H. Web Mining Research: A Survey. In: ACM SIGKDD Explorations Newsletter, ACM, Vol. 2, Issue 1, p.1-15, New York, NY, USA. 2000.

77 [LI et al., 2005] Li,Y.; Zheng, Z.; Dai, H. KDD CUP-2005 report: Facing a great challenge. In: ACM SIGKDD Explorations Newsletter, v.7, Issue 2, p.91–99, New York, NY, USA. 2005.

[LIMA, 2011] Lima, D. PairExtractor: Extração de Pares Livre de Domínio para Análise de Sentimentos. Trabalho de Graduação em Ciência da Computação – Centro de Informática/UFPE, Recife. 2011. Disponível em: http://www.cin.ufpe.br/~tg/2011- 2/dclal.pdf. Acesso em 13 dez. 2012.

[LIU et al., 2005] Liu, B.; Hu, M.; Cheng, J. Opinion observer: analyzing and com- paring opinions on the web. In: WWW ’05: Proceedings of the 14th international con- ference on World Wide Web, p. 342–351, ACM. New York, NY, USA, 2005.

[LIU et al., 2009] Liu, B.; Naraynan, R.; Choudhary, A. Sentiment Analysis of Condi- tional Sentences.In: Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, v.1, p.180–189. Singapore. 2009.

[LIU, 2006] Liu, B. Web data mining: Exploring Hyperlinks, Contents and Usage Data.In: SIGKDD Explorations, Springer, v.10, Issue 2, Chicago - USA. 2006.

[LIU, 2009] Liu, B.: Handbook of natural language processing. 2nd Ed., 2009. [LIU, 2010] Liu, B. Sentiment Analysis and Subjectivity. Handbook of Natural Language Processing. Chapman and Hall/CRC, 2a ed, Flórida – USA. 2010.

[LOPES et al., 2008] Lopes, T.; Hiratani, G.; Barth, F.; Rodrigues, O.; Maraccini, J. Mineração de Opiniões aplicada à Análise de Investimento. In: WebMedia'08 Com- panion Proceedings of the XIV Brazilian Symposium on Multimedia and the Web, New York – USA, p.117-120. 2008.

[MAGALHÃES, 2009] Magalhães, T. Uma metodologia de mineração de opiniões na web. Tese (Doutorado em Engenharia) - COPPE/UFRJ. Rio de Janeiro. 2009. Dis- ponível em: http://www.coc.ufrj.br/index.php/component/docman/doc_download/954- teresinha- moreira-de-magalhaes-doutorado?Itemid=. Acesso em 13 dez. 2012.

[MAUÁ, 2009] Mauá, D. Modelos de Tópicos na Classificação Automática de Res e- nhas de Usuários. Dissertação (Mestrado em Engenharia) – Escola Politécnica da Uni- versidade de São Paulo. São Paulo. 2009. Disponível em:

http://www.dominiopublico.gov.br/pesquisa/DetalheObraForm.do?select_action=&co_ obra=161219. Acesso 13 dez. 2012.

[MIHALCEA et al., 2007] Mihalcea, R.; Banal, C.; Wiebe, J. Learning Multilingual Subjectivity Language via Cross-Lingual Projections. In: Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics, p. 976-983, Prague. 2007.

78 [MITCHAELL, 1997] Mitchell, T. Machine Learning. McGraw-Hill Higher Educa- tion, New York, NY, USA. 1997

[MURAKAMI et al., 2009] Murakami, K.; Nichols, E.; Matsuyoshi, S.; Sumida, A.; Masuda, S.; Inui, K.; Matsumoto, Y. Statement Map: Assisting Information Credi- bility Analysis by Visualizing Arguments. In: Proceedings of the 3rd Workshop on Information Credibility on the Web (WICOW2009), p.43-50, Madrid, Espanha. 2009. [NOSLANG, 2012] NoSlang; Internet Slang Dictionary &Translator. Disponível em: http://www.noslang.com/dictionary/. Último acesso em 18 de Agosto de 2012. [OHANA & TIERNEY, 2009] Ohana, B.; Tierney, B. Sentiment classification of re- views using SentiWordNet. In: In 9th. IT & T Conference, Dublin, Ireland. 2009. [OXFORD, 1996]Indiana University; The Oxford English Dictionary: List of Ab- breviations.1996. Disponível em http://www.indiana.edu/~letrs/help- services/QuickGuides/oed-abbr.html. Último Acesso em 19 de Agosto de 2012.

[PAGE et al., 1998] Page, L.; Brin, S.; Motwani, R.; Winograd, T. The PageRank Ci- tation Ranking: Bringing Order to the Web. Stanford Digital Library Technologies

Project. Janeiro 1998. Disponível em:

http://www.cis.upenn.edu/~mkearns/teaching/NetworkedLife/pagerank.pdf. Último Acesso em 13 dez. 2012.

[PANG & LEE, 2004] Pang, B.; Lee, L. A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts. In: Proceedings of ACL- 04, 42nd Meeting of the Association for Computational Linguistics, p. 271–278, Barce- lona, ES. 2004.

[PANG & LEE, 2008] Pang, B.; Lee, L. Opinion Mining and Sentiment Analysis. In: Foundations and Trends in Information Retrieval, v.2 Issue 1-2, p.1-135, Hanover, MA, USA. 2008.

[PANG et al., 2002] Pang, B.; Lee, L.; Vaithyanathan, S. Thumbs up? sentiment clas- sification using machine learning techniques. In: Proceedings of the 2002 conference on empirical methods in natural language processing. New Jersey – USA, v.10, p.79-86. 2002.

[POPESCU & ETZIONI, 2005] Popescu A.; Etzioni, O. Extracting product features and opinions from reviews. In: HLT ’05: Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing. Morris- town - New Jersey - USA, p.339–346. 2005.

[SACK, 1994] Sack, W. On the computation of point of view. In: AAAI'94 Proceed- ings of the twelfth national conference on Artificial intelligence, Menlo Park, CA, USA, v.2, p.1488. 1994.

79 [SAGGION & FUNK, 2010] Saggion, H.; Funk, A. Interpreting SentiWordNet for Opinion Classification. In:Proceedings of the International Conference on Language Re- sources and Evaluation, LREC. 2010.

[SCHMID, 2011] Schmid, H. Treetagger - a language independent part-of-speech tagger. Disponível em: http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger. Último acesso em 08 de Dezembro de 2011.

[SEBASTIANI, 2002] Sebastiani, S. Machine learning in automated text categoriza- tion. In: ACM Computing Surveys. New York - USA, v.34, Issue 1, p. 1-47. 2002. [SILVA et al., 2012] Silva, N.; Lima, D.; Barros, F. SAPair: Um Processo de Análise de Sentimento no Nível de Característica. In: IV International Workshop on Web and Text Intelligence (WTI – 2012). Proc of the Brazilian Conference on Iteligent Systems ISSN 2316-4220,v. 1, p.1-10, ), Curitiba – PR. 2012.

[SINGHAL, 2001]Singhal, A. Modern Information Retrieval: A Brief Overview. In: Bulletin of the IEEE Computer Society Technical Committee on Data Engineer- ing 24, p. 35–43. 2001.

[SIQUEIRA, 2010] Siqueira, H. WhatMatter: Extração e visualização de caracterís- ticas em opiniões sobre serviços. Dissertação (Mestrado em Ciência da Computação) - Centro de Informática/UFPE. Recife. 2010.

[STEINBRUCH, 2006] Steinbruch, D. Um estudo de algoritmos para classificação automática de textos utilizando Naïve-Bayes. Pontifícia Universidade Católica do Estado do Rio de Janeiro. Dissertação de Mestrado. 2006. Disponível em:

http://www.maxwell.lambda.ele.puc-

rio.br/Busca_etds.php?strSecao=resultado&nrSeq=9637@1. Último Acesso em 13 dez. 2012.

[STOYANOV & CARDIE, 2006] Stoyanov, V.; Cardie, C. Partially supervised coref- erence resolution for opinion summarization through structured rule learning. In: EMNLP ’06: Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing, p. 336–344, Morristown, NJ, USA, Association for Computa- tional Linguistics. 2006.

[TAN et al., 2009] Tan, S.; Wu, G.; Tang, H.; Cheng, X.A novel scheme for domain- transfer problem in the context of sentiment analysis. In: Proceedings of CIKM, p. 979-982, New York, NY, USA. 2009.

[TOUTANOVA, 2003] Toutanova, K.; Klein, D.; Manning, C.; Singer, Y. Feature- Rich Part-of-Speech Tagging with a Cyclic Dependency Network. In: Proceedings

of HLT-NAACL, p. 252-259. 2003. Disponível em:

80 [TURNEY, 2002] Turney, P.: Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews. In: ACL '02 Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, p.417-424. USA. 2002.

[WIEBE & RAPAPORT, 1988] Wiebe, M.; Rapaport, W. A computational theory of perspective and reference in narrative. In: Proceedings of the ACL, p.131–138. 1988. [WIEBE & RILOFF, 2009] Wiebe, J.; Riloff, E. Creating subjective and objective sentence classifiers from unannotated texts. In: Proceedings of CICLing'05 Proceed- ings of the 6th international conference on Computational Linguistics and Intelligent Text Processing, p.486-497. 2005.

[WIEBE et al., 2004] Wiebe, J. M.; Wilson, T.; Bell, M.; Martin, M. Learning subjec- tive language. In: Computational Linguistics, v.30, Issue 3, p. 277–308. 2004.

[WIEBE, 1994] Wiebe, M. Tracking point of view in narrative. In: Computational Linguistics, v.20 Issue 2,p.233–287, Cambridge, MA, USA. 1994.

[WILSON et al., 2005] Wilson, T.; Wiebe, J.; Hoffman, P. Recognizing contextual polarity in phrase-level sentiment analysis. In: Proceedings of the Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing , p.347-354, British Columbia, Canada. 2005.

[WILSON et al., 2004] Wilson, T.; Wiebe J.; Hwa, R. Just how mad are you? Finding strong and weak opinion clauses. In: AAAI'04 Proceedings of the 19th national con- ference on Artifical intelligence, p. 761–767, San Jose, Califórnia, USA. 2004.

[WU & KUMAR, 2009] Wu, X.; Kumar, V. The Top Ten Algorithms in Data Min- ing. In:Chapman & Hall/CRC. 2009.

[YI et al. 2003] Yi, J., Nasukawa, T.; Bunescu, R.; Niblack, W. Sentiment Analyzer: Extracting Sentiments about a Given Topic using Natural Language Processing Techniques. In: Proceedings of the Third IEEE International Conference on Data Min- ing, p.427-434, Washington, DC, USA. 2003.

[YU & HATZIVASSILOGLOU, 2003] Yu, H.; Hatzivassiloglou, V. Towards An- swering Opinion Questions: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences. In: Proceeding EMNLP '03 Proceedings of the 2003 conference on Empirical methods in natural language processing, p.129-136, Strouds- burg, PA, USA. 2003.

[ZAGHLOUL et al., 2009] Zaghloul, W.; Lee, M.; Trimi, S. Text classification: Neu- ral Networks vs Support Vector Machines. In: Industrial Management and Data Sys- tems, v.109, No.5, p.708 – 717, 2009.

Documentos relacionados