• Nenhum resultado encontrado

Wiebe,2009). Muitas destas palavras, de acordo com o contexto em que se encon- tram no texto, podem ter conotação subjetiva ou objetiva, e portanto, adicionam ruído à classificação de sentimento.

• Detecção de Subjetividade: Um terceiro desafio é determinar quais documentos ou partes de documentos possuem conteúdo opinativo. A detecção de subjetividade em textos extraídos de reviews de produtos é simples, visto que esses textos são estritamente opinativos. Já em textos extraídos de debates ideológicos, fóruns, redes sociais, a detecção de subjetividade torna-se bastante complicada, pois além da estrutura do texto ser diferente dos reviews, é comum a ocorrência de ironias, sarcasmos, metáforas. Esses elementos podem ser erroneamente interpretados como opiniões positivas, sendo que na realidade são opiniões negativas.

• Textos Opinativos com Ruídos: Textos com erros de grafia, erros gramaticais, falta de pontuação e gírias ainda representam grandes desafios para os siste- mas de AS. Alguns desses problemas são solucionados a partir de um bom pré- processamento no texto.

2.6

Conclusão

Neste capítulo, apresentamos os principais conceitos relacionados à área de Análise de Sentimentos (e.g., níveis da AS, tipos de opiniões, etc), além das etapas de um sistema de Mineração da Opinião. Por fim, citamos alguns desafios que fazem com que a Análise de Sentimento seja uma das áreas mais pesquisadas no momento.

No próximo capítulo, apresentaremos com mais detalhes o processo de Análise de Sentimento em cima de textos de debates de produtos.

3

Análise de Sentimento em Debates

Polarizados

Neste capítulo, veremos com mais profundidade a classificação de sentimento em de- bates polarizados, por este ser o foco do nosso trabalho. Apresentaremos as principais contribuições da AS em debates ideológicos e debates não-ideológicos, descrevendo com maiores detalhes as abordagens e recursos utilizados nesses trabalhos.

A seção3.1mostrará uma visão geral sobre os problemas de realizar AS em textos de debates polarizados. As seções3.2, e3.3apresentarão algumas abordagens utilizadas para classificação de sentimentos em debates polarizados. A seção3.4descreve brevemente dois léxicos subjetivos bastante citados na literatura de AS. Na seção3.5apresentamos dois fenômenos liguísticos comuns em debates online e que foram tratados neste trabalho de mestrado. Por fim, a seção3.6apresentará as considerações finais.

3.1

Visão Geral

Uma tendência atual das pessoas é expressar seus pensamentos e pontos de vistas em micro blogs, redes sociais, ou em sites de debates1, opinando sobre os mais diversos assuntos, desde temas relacionados a política (e.g., guerras, direito sobre armas, aborto) a temas sobre opiniões acerca de produtos. Este comportamento gera oportunidades para empresas de marketing, que buscam gerir a publicidade de políticos em campanhas eleitorais, ou de marcas de produtos no mercado consumidor2, analisando o pensamento geral expresso nessas mídias sociais.

1www.createdebate.com, www.convinceme.net, www.politicalforum.com, www.forandagainst.com 2http://data-informed.com/presidential-debates-provide-living-laboratory-for-marketers-studying-

3.1. VISÃO GERAL

Quadro 3.1:Exemplos de posts do debate sobre a Existência de Deus

Postura Posts

God does not exist Before I began, let’s create three base ideas about God:

A. God is perfect B. God sees all

C. God can do whatever he/she wants

Now, based on those, we can create the following: 1. God sees evil in the world (B), but despite having the power to stop it (C), does not.

2. Any being that sees wrong, knows it can be stopped by him or her, and takes no action is flawed on some level. 3. This is contradictory to letter A, as in the scripture it is said that God is perfect.

4. Therefore, God doesn’t exist.

God does exist God sees all, God is perfect, God can do whatever He wants, Now..God sees evil but doesn’t stop it. So, therefore he is not real. When a murderer sees evil and does not stop it does that mean he doesn’t exist? When I see evil in the government or anything, and do nothing, because I can’t. Does that mean I am not real? Sometimes we can’t stop evil, and must let it happen. Everything happens for a reason the good and the bad. He is not responsible for Evil, Lucifer is. He may try to stop evil, but whether evil is stopped or not depends on if the person or being who is doing it is pure and good. Who is to say He didn’t try. You can’t prove he didn;t without some more

details.

God does not exist To prove there is not a God,you must prove that God does not exist Unless you can present evidence that God does not exist, than your argument is no better than your opposition.

God does exist Prove to me that the Flying Spaghetti Monster doesn’t exist.

No sir it doesn’t work that way. If you are asserting something exists you are required to back it up with evidence.

Nothing can be disproved, your must do your best to PROVE your stance using logic, reason and evidence. Things can be found to be VERY VERYVERY unlikely. Saying something exists doesn’t make it so.

Nesse contexto, a Análise de Sentimento busca extrair a postura/posicionamento (do inglês, stance) de um indivíduo a partir de textos polarizados. Somasundaran e Wiebe (2009) definem stance como uma opinião geral de uma pessoa sobre um objeto, idéia ou posição. Walker et al. (2012) defendem que este ponto de vista (postura) pode ser utilizado na identificação de qual lado um indivíduo está em um debate polarizado, e.g., a favor ou contra a existência de Deus, como ilustrado no quadro 3.13.

Discussões em fóruns, ou em sites de debates na Web sobre tópicos atuais (e.g., Qual o melhor console: PS3 ou Xbox?, Casamento Gay, etc.) são bem populares, e costumam ter uma forte carga emotiva. Os participantes desses debates apresentam suas preferências e justificam o porquê de suas opiniões estarem corretas. Além disso, para fortalecer seus pontos de vista, alguns debatedores apresentam argumentações negativas sobre seus adversários ou sobre as opiniões deles. Outra ocorrência comum é a mudança de opinião de alguns participantes durante a evolução do debate, chegando até a trocar de lado na discussão.

Complicando ainda mais este cenário, os participantes do debate ainda podem apre- sentar opiniões positivas sobre alguns aspectos do objeto (produto ou tópico) sendo apoiado pelo lado adversário, sem realmente mudar sua postura no debate. Além disso, alguns debatedores chegam a manifestar opiniões negativas sobre aspectos dos tópicos que defendem no debate. A estes fatores, damos o nome de concessões (Robaldo et al., 2010).

Existem alguns outros elementos presentes em debates polarizados que acrescentam dificuldades à realização da AS. A linguagem informal predominante nestes tipos de textos, e a grande quantidade de gírias, são fortes fontes de ruído na etapa de classificação de sentimento. Assim, para determinar a polaridade nesses debates, é necessário, além de identificar as opiniões positivas e as negativas, determinar sobre o que essas opiniões estão tratando, ou seja, as entidades que estão sendo avaliadas. Nesses debates, algumas das entidades presentes são citadas por referências anafóricas (Somasundaran e Wiebe, 2009), o que pode dificultar a tarefa de associar uma palavra opinativa a um objeto em discussão.

Walker et al.(2012) examinaram a classificação da postura dos participantes dentro do corpus de 14 debates distintos, 10 debates ideológicos, e 4 debates não ideológicos. A fim de demonstrar a dificuldade da AS nesses tipos de textos, os autores conduziram um experimento através do Mechanical Turk4onde a classificação dos posts de debate foi

3http://www.convinceme.net/debates/150/Existence-of-God.html 4https://www.mturk.com/mturk/welcome