• Nenhum resultado encontrado

Neutro ou negativo? Avaliação de sentimentos expressados em comentários avaliativos de serviços de hospedagem

N/A
N/A
Protected

Academic year: 2021

Share "Neutro ou negativo? Avaliação de sentimentos expressados em comentários avaliativos de serviços de hospedagem"

Copied!
52
0
0

Texto

(1)

BACHARELADO EM SISTEMAS DE INFORMAÇÃO

GUSTAVO COSSA DE PAULA SANTOS

MARCELO MACHADO SANTOS

NEUTRO OU NEGATIVO? AVALIAÇÃO DE SENTIMENTOS EM

COMENTÁRIOS AVALIATIVOS DE SERVIÇOS DE HOSPEDAGEM

TRABALHO DE CONCLUSÃO DE CURSO

CURITIBA

2018

(2)

NEUTRO OU NEGATIVO? AVALIAÇÃO DE SENTIMENTOS EM

COMENTÁRIOS AVALIATIVOS DE SERVIÇOS DE HOSPEDAGEM

Trabalho de Conclusão de Curso apresentado como requisito parcial para obtenção do título de Bacharel em Sistemas de Informação.

Orientador: Thiago H. Silva

CURITIBA

2018

(3)

Diretoria de Graduação e Educação Profissional

Departamento Acadêmico de Informática

Coordenação do Curso de Bacharelado em Sistemas de Informação

TERMO DE APROVAÇÃO

NEUTRO OU NEGATIVO? AVALIAÇÃO DE SENTIMENTOS EM

COMENTÁRIOS AVALIATIVOS DE SERVIÇOS DE HOSPEDAGEM

por

Gustavo Cossa de Paula Santos

Marcelo Machado Santos

Este Trabalho de Conclusão de Curso foi apresentado como requisito parcial à obtenção do grau de Bacharel em Sistemas de Informação na Universidade Tecnológica Federal do Paraná - UTFPR - Câmpus Curitiba. O(a)(s) aluno(a)(s) foi(ram) arguido(a)(s) pelos membros da Banca de Avaliação abaixo assinados. Após deliberação a Banca de Avaliação considerou o trabalho ________________________________________.

________________________________

<Prof. Thiago Henrique Silva>

(Presidente - UTFPR/Curitiba)

________________________________

<Prof. Alexandre Reis Graeml>

(Avaliador(a) 1 UTFPR/Curitiba)

________________________________

<Profa.Rita Cristina Galarraga Beradi>

(Avaliador 2(a) - UTFPR/Curitiba)

________________________________

<Profa. Leyza Baldo Dorini>

(Professora Responsável pelo TCC – UTFPR/Curitiba)

_____________________________

<Prof. Leonelo Dell Anhol Almeida>

(Coordenadordo curso de Bacharelado em Sistemas de Informação – UTFPR/Curitiba)

(4)

Aos nossos pais, irmãos e companheiras pela compreensão, apoio

e amor incondicional. Ao professor orientador Thiago H. Silva

pela ajuda, atenção e paciência.

À UTFPR pela oportunidade de fazer este curso. Aos colegas que

nos deram auxílio técnico e direção. E a todos que participaram

direta ou indiretamente na nossa formação, o nosso muito

obrigado.

(5)

SANTOS, G.; SANTOS, M. Neutro ou negativo? Avaliação de sentimentos expressados em comentários avaliativos de serviços de hospedagem. Trabalho de conclusão de curso, 2018. Por que nos comentários avaliativos do Airbnb, Uber, Couchsurfing e demais serviços de econo-mia compartilhada é tão raro vermos pessoas falando mal dos serviços oferecidos pelas outras pessoas? No presente trabalho é feita uma comparação entre os sentimentos dos comentários do Booking.com, Airbnb e Couchsurfing e também uma nova abordagem de como a listagem do Airbnb poderia ser diferente se os sentimentos fossem levados em conta. Através de uma ex-tensa coleta e mineração de dados dos comentários avaliativos de cada uma das plataformas já citadas, e aplicação de análise de sentimentos, foi possível a comparação dos resultados obtidos e assim chegar a conclusão que, de fato, nas ferramentas de economia compartilhada, as polari-dades tendem a ser mais positivas quando comparadas às ferramentas da economia formal. Essa tendência de positividade acaba gerando um problema para a tomada de decisão de um consu-midor dessas plataformas. Em muitos casos, é difícil distinguir um local bom de um médio/ruim através dos comentários avaliativos. Para solucionar esse problema, no presente trabalho é pro-posta a atribuição de uma nota obtida através de uma fórmula que leva em conta a polaridade do sentimento de um local e sua quantidade de comentários. Quando a base de dados é orde-nada de acordo com essa nota, os melhores locais ficam melhor classificados do que os locais médios/ruins, auxiliando o usuário em uma busca. Para comprovar a dificuldade de um usuário distinguir uma opção boa de uma média/ruim foi aplicada uma pesquisa, respondida por 30 pes-soas, onde deveriam classificar locais escolhidos entre opções que iam de muito ruim à muito bom de acordo com a nota obtida no processo descrito acima. Na pesquisa foi verificado que é de fato muito difícil para um consumidor tomar sua decisão baseando-se nos comentários de outros usuários. Locais com as piores notas ainda foram classificados como médios e/ou bons. Evidenciando que a ordenação em uma busca faz toda a diferença. Palavras-chaves: análise de sentimentos. serviços de hospedagem. economia compartilhada. economia forma. economia colaborativa. reviews. comentários avaliativos.

(6)

SANTOS, G. s. M. Neutro ou negativo? Avaliação de sentimentos em comentários avaliativos de serviços de hospedagem. BSc. Thesis, 2018.

Why is it so rare to see people talking badly about the services offered by other people in the comments of Airbnb, Uber, Couchsurfing and other services of shared economy? In the present work a comparison is made between the sentiments of the reviews of Booking.com, Airbnb and Couchsurfing and also a new approach to how the Airbnb listing could be different if the feelings were taken into account. Through an extensive collection and data mining of the evaluative comments of each of the platforms already mentioned and the application of sentiment analysis, it was possible to compare and reach the conclusion that, in fact, in the tools of shared economy, the polarities tend to be more positive when compared to the tools of the formal economy. This tendency of positivity ends up generating a problem for the decision making of a consumer of these platforms. In many cases, it is difficult to distinguish a good location from a medium / bad one through evaluative comments. To solve this problem, the present work proposes the attribution of a score obtained through a formula that takes into account the polarity of the feeling of a place and its quantity of comments. When the database is ordered according to this note, the best places are ranked better than the average/bad sites, helping the user in a search. To prove this difficulty, a survey was applied and answered by 30 people. They should classify the options from very bad to very good according to the score obtained in the process described above. In the survey it was found that really is very difficult for a consumer to make his decision based on the comments of other users. Places with the worst grades were still classified as average or good. Evidence that ordering a search makes all the difference. Key-words: sentiment analysis. acommodation services. sharing economy. reviews.

(7)

Figura 1 – Booking.com . . . 17

Figura 2 – Airbnb . . . 18

Figura 3 – Couchsurfing . . . 19

Figura 4 – Pesquisa do termo “Sentiment Analysis” no Google Trends . . . 20

Figura 5 – Comentário avaliativo na Amazon . . . 24

Figura 6 – Comentário avaliativo no Booking.com . . . 25

Figura 7 – Comentário avaliativo no Airbnb . . . 25

Figura 8 – Comentário avaliativo no Couchsurfing . . . 26

Figura 9 – Passos metodológicos . . . 30

Figura 10 – Gráfico com a distribuição dos sentimentos entre todas as plataformas. . . 31

Figura 11 – Distribuição dos sentimentos - Brasil . . . 33

Figura 12 – Distribuição dos sentimentos - EUA . . . 33

Figura 13 – Distribuição dos sentimentos - São Paulo . . . 34

Figura 14 – Distribuição dos sentimentos - Nova Iorque . . . 34

Figura 15 – Distribuição dos sentimentos - Rio de Janeiro . . . 35

Figura 16 – Distribuição dos sentimentos - Las Vegas . . . 35

Figura 17 – Distribuição dos sentimentos - Curitiba . . . 36

Figura 18 – Distribuição dos sentimentos - Boston . . . 36

(8)

Tabela 1 – Estatísticas básicas dos dados para cada plataforma considerada. . . 29 Tabela 2 – Exemplos de comentários e força da polaridade do sentimento associada. . . 30 Tabela 3 – Dez tópicos latentes dos comentários negativos observados no Booking e

Airbnb. (Português) . . . 39 Tabela 4 – Dez tópicos latentes dos comentários negativos observados no Booking e

Airbnb. (Inglês) . . . 39 Tabela 5 – Resultados do experimento com usuários, contendo a média de nota

atri-buída pelos voluntários para cada local . . . 42 Tabela 6 – Exemplos de cálculo da nota baseado nos comentários e polaridade . . . 45

(9)

1 INTRODUÇÃO . . . . 9 1.1 DEFINIÇÃO DO PROBLEMA. . . 9 1.2 JUSTIFICATIVA DO PROBLEMA . . . 9 1.3 OBJETIVOS . . . 10 1.3.1 Objetivo Geral . . . 10 1.3.2 Objetivos Específicos. . . 10 1.4 METODOLOGIA . . . 11 2 TRABALHOS RELACIONADOS . . . 13 3 CONTEXTUALIZAÇÃO . . . 14

3.1 TIPOS DE ECONOMIA E SUAS DIFERENÇAS . . . 14

3.1.1 Economia Compartilhada . . . 14

3.1.1.1 Exemplos e comparações . . . 14

3.1.2 Economia Formal . . . 15

3.1.3 Diferenças . . . 15

3.1.4 Escolha dos serviços de hospedagem para serem utilizados . . . 15

3.1.5 Sistemas considerados . . . 16 3.1.5.1 Booking . . . 16 3.1.5.2 Airbnb . . . 17 3.1.5.3 Couchsurfing. . . 18 3.2 ANÁLISE DE SENTIMENTOS. . . 19 3.2.1 O que é . . . 19

3.2.2 Onde pode ser aplicada . . . 20

3.2.3 Como pode ser aplicada . . . 21

3.2.3.1 Como foi aplicada no contexto. . . 22

3.2.4 Opções de ferramentas . . . 22

3.3 COMENTÁRIOS AVALIATIVOS . . . 23

3.3.1 Importância . . . 23

3.3.2 Relação com os diferentes tipos de economia . . . 24

3.3.3 Comentários avaliativos nas ferramentas escolhidas. . . 24

4 PASSOS METODOLÓGICOS . . . 27

4.1 MINERAÇÃO E ARMAZENAMENTO DE DADOS . . . 27

4.2 ESCOLHA DAS CIDADES . . . 27

4.3 OBTENÇÃO DOS DADOS . . . 28

4.3.1 Webcrawlersdo Booking e Couchsurfing . . . 28

4.3.2 API Airbnb . . . 28

4.4 ARMAZENAMENTO DOS DADOS . . . 29

4.4.1 Escolha da ferramenta . . . 29

5 RESULTADOS . . . 31

5.1 COMPARAÇÕES DOS SENTIMENTOS - DADOS AGREGADOS . . . 31

5.2 COMPARAÇÕES DOS SENTIMENTOS - DADOS DESAGREGADOS . . . 32

5.2.1 Países . . . 33

5.2.2 Cidades . . . 34

5.3 COMPARAÇÃO ENTRE QUANTIDADE DE COMENTÁRIOS E POLARIDADE MÉDIA . . . 37

5.4 CONTEÚDO DOS COMENTÁRIOS NEGATIVOS. . . 37

(10)

6.2 RESULTADOS . . . 41

7 PROPOSTA NOVA LISTAGEM AIRBNB . . . 43

7.1 POR QUE ANALISAR ALÉM DAS ESTRELAS . . . 43

7.2 NOTA PARA A NOVA CLASSIFICAÇÃO DE LOCAIS. . . 43

7.2.1 Construção da equação . . . 43

8 CONCLUSÃO . . . 46

(11)

1 INTRODUÇÃO

1.1 DEFINIÇÃO DO PROBLEMA

Utilizar opiniões de outros usuários sobre um produto ou serviço, é cada dia mais uma ferramenta indispensável para a tomada de decisão de um novo consumidor (FERREIRA et al., 2016). Aliado a isso, não é apenas nas redes sociais, portais de mídia ou de acesso à informação que pessoas expõem e debatem seus pontos de vista à respeito de notícias, eventos, aconteci-mentos. Essas opiniões também são explicitadas na avaliação de artefatos, os denominados co-mentários avaliativos, estando presentes na grande maioria das plataformas que trabalham com produtos e/ou serviços na web.

Mostrada a grande relevância desses comentários avaliativos, o presente trabalho visa comparar as opiniões dispostas em plataformas de serviços de hospedagem que trabalham com diferentes tipos de economias, compartilhada e formal.

Verificando o sentimento, ou seja, a polaridade (negativa, neutra ou positiva), presente em cada comentário coletado, é possível fazer uma comparação de maneira agregada e desa-gregada das plataformas. A distribuição da polaridade dos comentários presentes na economia compartilhada, que representa atividades colaborativas (pessoa-pessoa) para obter, fornecer, ou compartilhar o acesso a bens e serviços, (HAMARI; SJÖKLINT; UKKONEN, 2016) será igual à da economia formal, composta por hotéis e pousadas (esses conceitos serão descritos com mais detalhes na seção 3.1)?

Esse é um ponto que o presente trabalho visa verificar. Tendo em mente que estas opi-niões podem ser muito influentes para tomadas de decisão em relação a vários tipos de serviços e produtos. Avaliações de usuários com recomendações ou contraindicações podem influenciar diretamente nas decisões de compra (SPARKS; BROWNING, 2011).

1.2 JUSTIFICATIVA DO PROBLEMA

A relevância das opiniões de outros usuários a respeito de um produto ou serviço na es-colha do consumidor é a principal justificativa e motivação do presente estudo, que visa verificar se de fato avaliar os comentários avaliativos é relevante para a tomada de decisão.

Outra justificativa é a popularização das plataformas que trabalham com o modelo pro-posto pela economia compartilhada e seu crescimento no mercado em diversos setores em que estão inseridas. Essa difusão fez com que entender a relação das pessoas para com essas plata-formas desperte a atenção tanto do lado de pesquisa, para entender os porquês deste comporta-mento, quanto do lado comercial/empresarial para que cada vez mais o mercado saiba quais são

(12)

os sentimentos do consumidor perante cada modelo de negócio.

1.3 OBJETIVOS

1.3.1 Objetivo Geral

Através da comparação de análises de sentimento de comentários avaliativos entre sis-temas econômicos formais e compartilhados de serviços de hospedagem, responder à pergunta de pesquisa: "os sentimentos presentes nos comentários avaliativos apresentam diferenças em serviços de hospedagem que trabalham com diferentes tipos de economia?".

No presente trabalho procura-se comparar o comportamento das pessoas nos comen-tários avaliativos, através dos sentimentos expressados, justamente comparando empresas que trabalham com os tipos de economias já explanados e que estão inseridas no mesmo setor, no caso deste trabalho, o de hospedagem.

1.3.2 Objetivos Específicos

∙ Coletar e tratar os comentários avaliativos das plataformas estudadas (Airbnb, Couchsur-fing e Booking).

∙ Executar a análise de sentimentos nos comentários avaliativos das plataformas escolhidas. ∙ Comparar e entender os resultados das análises visando responder à pergunta de pesquisa. ∙ Comprovar os resultados através de uma pesquisa com possíveis usuários

∙ Criar uma solução para o problema

O restante do trabalho é organizado da seguinte forma, No capítulo 2 alguns trabalhos relacionados são apresentados para mostrar o estado da arte dos assuntos envolvidos no presente trabalho. Os capítulos 3 compõe o desenvolvimento e contextualização dos assuntos e conceitos envolvidos no tema. No capítulo 4 os passos metodológicos são explanados e detalhados. Os resultados obtidos são evidenciados no capítulo 5. Em sequência a pesquisa feita com usuários para verificar os resultados é o tema do capítulo do 6. No capítulo 7 é apresentada uma nova proposta de pesquisa para a plataforma do Airbnb. O trabalho é finalizado no capítulo 8 com a conclusão.

(13)

1.4 METODOLOGIA

A metodologia utilizada para as verificações do projeto será a comparação de análises de sentimentos aplicada em três sites de serviços de hospedagem que trabalham com diferentes tipos de economia:

∙ Economia formal: será utilizado o site booking.com.

∙ Economia compartilhada: serão utilizados os sites Airbnb.com e Couchsurfing.com. As etapas do processo serão:

1. A obtenção dos dados:

Os dados provenientes de alguns sites são obtidos a partir de um webcrawler, um software que navega pela World Wide Web de forma automatizada. O webcrawler faz download de páginas Web para criar índices ou cache, também conhecido como Web Spider, automatic indexerou Web Robots, é aplicado em diversas áreas para mapear ou obter informação de um determinado site. Grandes motores de busca como o Google utilizam essa forma para obter informações e indexar sites. Um webcrawler pode, por exemplo, acessar as páginas que listam todos os hotéis de determinadas cidades e coletar as informações como nomes e o link do hotel. Com esses links o software acessa e obtém informações de hospedagem do hotel e também das avaliações que clientes fizeram após sua hospedagem.

Para o Airbnb, os dados foram coletados através de API - Application Programming In-terface, ou em português, Interface de Programação de Aplicativos. Essa interface é o conjunto de padrões de programação que permite a construção de aplicativos e a utiliza-ção não é evidente ao usuário.

Um software que acessa as informações da API de um site para consultar informações. Pode ser possível extrair informações de lugares para hospedagem, número máximo de pessoas para hospedagem, quantidade de avaliações, comentários dos clientes e também a nota que o lugar recebeu.

2. Processamento e armazenamento dos dados

O processamento dos dados é feito por meio de um algoritmo que trata as informações que são obtidas através de webcrawler e da API e as armazena em um banco de dados estruturado. Nesta estrutura estão presentes dados a respeito das cidades selecionadas, dos clientes, dos comentários, das respostas dadas aos comentários (caso a plataforma permita esse tipo de comunicação), entre outros dados que são possíveis de coletar, que possuam relevância para o projeto.

(14)

3. Análise de Sentimentos

A análise de sentimentos será feita com a utilização do software SentiStrength, que a par-tir da introdução dos dados, resulta em uma avaliação individual para cada comentário avaliativo, assim sendo possível dizer o teor geral dos sentimentos em cada comentário, para cada um dos sites.

Basicamente, a escolha do SentiStrength foi devido à sua eficácia para textos curtos, como costumam ser os comentários avaliativos (GUZMAN; MAALEJ, 2014).

4. Comparação

Após aplicada a análise de sentimentos, os resultados gerais de cada plataforma foram comparados. Assim, verifica-se as diferenças entre os sentimentos. Se os presentes nas plataformas de economia formal são no geral mais negativos do que os que estão dispostos nos comentários avaliativos da economia compartilhada.

5. Avaliação dos Resultados

Com as análises dos dados obtidos, a conclusão é que de fato, nas ferramentas de economia compartilhada os sentimentos são mais positivos, de maneira geral. Enquanto na economia formal existem muitos casos de comentários negativos, na economia compartilhada são raros.

Além da comparação dos sentimentos, também é feita uma pesquisa onde os respondentes devem classificar um local da economia compartilhada, para verificar se, de fato, é possível distinguir a qualidade de uma acomodação, baseando-se nos comentários feitos por outros usuários.

Com o resultado da comparação dos sentimentos e da pesquisa com usuários é possível propor uma nova maneira de avaliar os comentários avaliativos em cada plataforma es-tudada. Uma nota, gerada através de uma fórmula que contempla a média da polaridade dos sentimentos presentes nos comentários e a quantidade de comentários de um local foi desenvolvida.

Aplicando esta fórmula para cada acomodação presente no banco de dados e dividindo essa base em quartis, tem-se exemplos de quais locais são muito bons, bons, ruins e muito ruins.

(15)

2 TRABALHOS RELACIONADOS

A importância dos dados gerados por usuários de mídias sociais já foi alvo de estudo em diferentes temáticas. Alves (2016), utilizou dados da rede social Twitter para criar um simulador de de previsão de resultados na bolsa de valores.

A estratégia da autora do trabalho supracitado foi utilizar análise de sentimentos, e existem diversas ferramentas que fazem essa análise. Fazendo um benchmarking entre várias delas, Abbasi, Hassan e Dhar (2014), mostram quais ferramentas são as mais indicadas para diferentes tipos de texto. Dentre as análises, os autores mostram a alta precisão do SentiStrength em textos provenientes de mídias sociais. A ferramenta foi treinada com textos de redes como o Twitter. Por esse motivo foi a escolhida no presente trabalho.

Através da análise de sentimentos de informações geradas por usuários é possível ob-ter informações de candidatos políticos, aceitação após um debate, ou após assumir um cargo político (AFONSO et al., 2011)

Ainda sobre informações geradas por usuários, os consumidores de produtos também avaliam suas aquisições e Pang e Lee (2008) evidenciam que esses comentários impactam dire-tamente na decisão de compra de um novo consumidor de um produto e/ou serviço.

Estudando esses comentários avaliativos e seus impactos na plataforma do Airbnb, Fradkin et al. (2015), verificaram que 72% escrevem um comentários a respeito do local onde estiveram. 94% das avaliações de estrelas variam entre 4 e 5. Esse número é importante para mostrar que, de fato, verificar apenas as estrelas de um local para a tomada de decisão pode não ser a melhor estratégia.

(16)

3 CONTEXTUALIZAÇÃO

3.1 TIPOS DE ECONOMIA E SUAS DIFERENÇAS

Este capítulo visa elucidar os conceitos utilizados no desenvolvimento do trabalho. Como as diferenças entre economia formal e economia compartilhada, análise de sentimentos e comentários avaliativos. Apresenta-se também exemplos e comparações entre esses modelos de negócio, e também como foi feita a escolha das ferramentas que serão comparadas.

3.1.1 Economia Compartilhada

A economia compartilhada é um modelo de negócio onde pessoas utilizam de maneira colaborativa seus bens pessoais e podem ou não receber um valor monetário em troca. Essa economia beneficia tanto quem fornece quanto quem consome os serviços.

Enquanto pessoas que possuem algum bem, como um carro, um apartamento, um quarto vazio em casa, podem obter uma renda extra, pessoas que necessitam desses recursos podem utilizá-los por um valor muitas vezes menor do que os praticados na economia formal ou até mesmo de graça (ZERVAS; PROSERPIO; BYERS, 2014).

Esse modelo de negócio é fruto do boom da tecnologia, que proporciona a conexão de pessoas que possuem algo a oferecer com os consumidores dos serviços. As empresas que trabalham com esse tipo de economia se caracterizam por possuírem websites e aplicativos como principal forma de conectar fornecedores e consumidores, o que faz com que se caracterizem, antes de qualquer coisa, como empresas de tecnologia.

3.1.1.1 Exemplos e comparações

∙ Hospedagem:

No mercado de hospedagem existem o Airbnb e o Couchsurfing. O primeiro proporciona que pessoas ofereçam estadia tanto em quartos desocupados de suas casas, quanto em casas e apartamentos inteiros para que seus hóspedes possam se alocar pagando uma diária estipulada pelo anfitrião. O próprio Airbnb se define como "uma mídia social que conecta pessoas que possuem um espaço para compartilhar com pessoas que buscam um espaço para ficar"(ZERVAS; PROSERPIO; BYERS, 2014).

Já no Couchsurfing, pessoas compartilham seus espaços de maneira semelhante ao que ocorre no Airbnb, porém de forma gratuita.

(17)

Esses serviços são os principais concorrentes dos hotéis, pousadas e até imobiliárias, que sempre foram os dominantes desse mercado.

∙ Transporte:

Exemplos de empresa de sucesso que trabalham nesse modelo existe a empresa multinaci-onal norte-americana Uber, que oferece que pessoas utilizem seus carros como forma de proporcionar caronas para outros indivíduos, da mesma forma que o serviço formal clás-sico proporcionado pelos táxis. Em reportagem feita em 2016, o jornal Gazeta do Povo comparou o preço praticado pelo Uber e pelo Táxi na cidade de Curitiba, enquanto o Uber cobra uma tarifa base de R$ 3,00, R$ 0,25 por minuto e R$ 1,12 por quilômetro rodado, o Táxi cobra de inicio R$ 5,40, R$ 0,40 por minuto e R$ 2,70 por quilômetro (na bandeira 1).(PIVA; FARIA, 2016)

3.1.2 Economia Formal

Neste contexto, podemos definir economia formal como o sistema clássico de aquisição de bens e serviços, táxis, hotéis, aluguel de imóvel por imobiliárias. Ou seja, instituições privadas ou públicas que oferecem seus bens e serviços para pessoas que consomem esses produtos e pagam um valor monetário para essas empresas em uma clara relação empresa-pessoa.

3.1.3 Diferenças

As diferenças entre economia formal e compartilhada é que, na economia formal, é exe-cutado um modelo de negócio empresa-pessoa, enquanto na economia compartilhada, ferramen-tas fazem o intermediador para que possa existir um negócio seguro de maneira pessoa-pessoa, mas que também pode ser caracterizado como pessoa-empresa-pessoa.

3.1.4 Escolha dos serviços de hospedagem para serem utilizados

No presente trabalho, como haverá uma comparação de comentários avaliativos em fer-ramentas de hospedagem online, principalmente na economia formal existem muitas plataformas que poderiam ser escolhidas, como:

∙ Booking.com (www.booking.com) ∙ Expedia (www.expedia.com)

(18)

∙ Decolar (www.decolar.com) ∙ Hoteis.com (www.hoteis.com)

∙ Submarino Viagens (www.submarinoviagens.com.br)

Enquanto, no mesmo setor, existem poucas ferramentas que trabalham com o modelo de economia colaborativa, as mais conhecidas são:

∙ Airbnb (www.airbnb.com)

∙ Couchsurfing (www.Couchsurfing.com)

A partir dessas opções, devido a ser um dos maiores websites que existem nesse se-tor e com uma grande base de dados de comentários avaliativos (BJØRKELUND; BURNETT; NØRVÅG, 2012), o escolhido para representar a economia formal foi o Booking.com.

Para a economia compartilhada, como só foram encontradas duas plataformas e elas trabalham de maneira distinta (uma possui compensação financeira e outra não), ambas foram escolhidas.

3.1.5 Sistemas considerados

Como contextualização, esta seção tem como objetivo introduzir melhor as plataformas escolhidas para o estudo.

3.1.5.1 Booking

A Booking, fundada em 1996 em Amsterdã, é hoje uma das maiores empresas de e-commerce de hospedagens do mundo. A Booking conta com mais de 15.000 funcionários em 198 escritórios em 70 países pelo mundo.

Conectando viajantes a várias opções de hospedagem, incluindo desde cama e cafés (B&B) administrados por famílias, a resorts 5 estrelas. O site e os aplicativos móveis da Booking estão disponíveis em mais de 40 idiomas, oferecem mais de 28 milhões anúncios no total, e cobrem 133.000 destinos em 228 países e territórios no mundo todo.

Essa empresa representa um dos sites mais populares de hospedagem da economia formal. Todo dia, mais de 1.550.000 diárias são reservadas na plataforma da Booking.

(19)

Figura 1 – Booking.com

3.1.5.2 Airbnb

O Airbnb, fundado em 2008, é uma plataforma de aluguel de acomodações ao redor do mundo. Presente em 190 países e em mais de 34 mil cidades, conta atualmente com mais de 2 milhões de acomodações e acumula 60 milhões de hóspedes. O mercado de acomodações do Airbnb oferece acesso a vários tipos de acomodações de apartamentos, a vilas e castelos.

O Airbnb empodera economicamente milhões de pessoas no mundo inteiro para abri-rem e capitalizaabri-rem seus espaços, tornando-se empreendedores da área de hospedagem. Essa plataforma vem ajudando muitos viajantes a economizar, por se tratar de uma opção, no geral, mais barata que os hotéis. Além disso, outro fator que pode ajudar a explicar o sucesso dessa plataforma é oferecimento de experiências diferenciadas e mais pessoais do que, tipicamente, são obtidas em hotéis.

(20)

Figura 2 – Airbnb

3.1.5.3 Couchsurfing

O Projeto Couchsurfing (CS), criado em 2004, é uma plataforma de hospedagem com base na Internet. Já atendeu a mais de 11 milhões de viajantes em mais 150.000 cidades ao redor do mundo. O diferencial desse serviço é que as hospedagens são gratuitas e, tipicamente, o contato pessoal entre o hospedeiro e o hóspede é maior do que no Airbnb e Booking.

Os usuários usam o site para coordenar as acomodações. São disponibilizadas várias funcionalidades como perfis pessoais ou coletivos detalhados, bem como um sistema opcional de verificação de identidade, um sistema de certificação pessoal e sistema de referências pessoais para aumentar a segurança e a confiança entre membros.

Talvez pelo fato de não envolver valores monetários, o perfil do usuário tem um grande valor nessa plataforma. Candidatos a uma hospedagem com um perfil mal avaliado ou duvidoso podem ter uma maior dificuldade em encontrar uma acomodação do que usuários com um perfil impecável.

(21)

Figura 3 – Couchsurfing

A motivação para a economia compartilhada ter 2 representantes e apenas 1 da econo-mia formal é pelo fato do Couchsurfing ser gratuito. O objetivo é verificar se o fato de não haver cobrança pela estadia altera o sentimento dos comentários avaliativos da plataforma quando comparados ao Airbnb, outro representante da economia compartilhada.

3.2 ANÁLISE DE SENTIMENTOS

3.2.1 O que é

A análise de sentimentos tem como objetivo encontrar e definir técnicas capazes de extrair as opiniões, sentimentos, emoções e informações expressos em textos (NARAYANAN; LIU; CHOUDHARY, 2009). A identificação de sentimentos em textos vem sendo uma das áreas de pesquisa mais destacadas em Processo de Linguagem Natural (Interações entre computadores e línguas (naturais) humanas) (LIU, 2010).

A análise de sentimentos é o estudo computacional de como opiniões, atitudes e emo-ções são expressadas na linguagem natural, podendo ser considerada uma disciplina de estudo, englobando áreas como psicologia, marketing e computação. A análise de sentimentos tem como propósito encontrar respostas, como por exemplo: “É bom ou ruim”, “é a favor ou contra”, “é positivo ou negativo”.

A principal função da análise de sentimentos é descobrir o que as pessoas pensam e quais são suas opiniões sobre determinado tema com o auxílio da tecnologia. (YANG; YU, 2013), reduzindo drasticamente a necessidade de se ler grandes quantidades de documentos para extrair opiniões (YU; DUAN; CAO, 2013). Pessoas e empresas estão cada vez mais interessadas

(22)

em análise de sentimentos, querendo acompanhar e observar o que os grupos de pessoas vêm dizendo sobre um tema que tem interesse. Nas empresas, é comum o interesse pela análise de sentimentos, buscando-se informações sobre a aceitação de um novo produto ou procurando receber feedbacks para melhoria.

Figura 4 – Pesquisa do termo “Sentiment Analysis” no Google Trends

Com a explosão das redes sociais, principalmente o Twitter em 2006, o termo análise de sentimentos teve um aumento nas buscas a fim de aprofundar mais a compreensão pelo as-sunto. Na figura 4, mostra o termo “Sentiments Analysis” no buscador Google a partir de 2006 (BENEVENUTO; RIBEIRO; ARAÚJO, 2015).

Os métodos atuais para detecção de sentimentos em sentenças são divididos em dois temas: Baseados em aprendizado de máquina e métodos léxicos. Métodos baseados em aprendi-zado de máquina geralmente dependem de base de dados rotulados para treinar os classificadores (PANG; LEE; VAITHYANATHAN, 2002), o que pode ser considerado uma desvantagem de-vido ao custo de obtenção de dados rotulados. Por outro lado, métodos léxicos utilizam listas, di-cionários de palavras associadas e sentimentos específicos. Apesar de não dependerem de dados rotulados para treinamento, a eficiência dos métodos léxicos está diretamente ligada ao voca-bulário utilizado, para os diversos contextos existentes (BENEVENUTO; RIBEIRO; ARAÚJO, 2015).

3.2.2 Onde pode ser aplicada

“Qual é a opinião das outras pessoas sobre esse produto? ” Esta sempre foi uma in-formação importante para as pessoas durante uma tomada de decisão. Antes de existir a Web, os indivíduos pediam opiniões de amigos, parentes para recomendar um determinado serviço ou produto (PANG; LEE, 2008). Com o avanço da Internet, o acesso a essas informações ficou cada vez mais de fácil. Quando necessitamos tomar alguma decisão, consultamos opiniões e experiencias das pessoas.

(23)

Empresas e organizações estão em busca de consumidores em potencial ou busca de opiniões de clientes sobre os seus produtos e serviços.

No passado, quando alguém precisava de opinião sobre um determinado assunto de qualquer natureza, só era possível obter as opiniões de seu círculo social, amigos e conheci-dos. Quando uma organização precisava buscar as opiniões públicas, necessitava recorrer a uma pesquisa de opinião, o que demandava tempo e custo operacional.

Com o crescimento da mídia social (fóruns de discussões, blogs, Twitter, vídeos, views, comentário e postagens em rede social) na Web, consumidores e organizações estão re-correndo a esse recurso para buscar opiniões sobre os temas de interesse para sua tomada de decisão. Hoje, se uma pessoa está interessada em comprar um produto ou adquirir um serviço, ela não está limitada apenas ao seu círculo social. A opinião de outras pessoas que já usufruí-ram do serviço ou adquiriusufruí-ram o produto através da Web também pode ser obtida. A análise de sentimentos existe em inúmeras aplicações, algumas delas são detalhadas a seguir.

∙ Produtos: Podemos utilizar a análise de sentimentos para determinar a aceitação de um produto que acabou de ser lançado ao mercado e assim é possível determinar estratégias de Marketing. É também possível avaliar um produto ou parte dele, como por exemplo, um celular que tem uma câmera muito boa, porém, sua bateria tem uma curta duração (FANG; ZHAN, 2015).

∙ Mercado Financeiro: Uma das principais características do mercado financeiro é a ava-liação dos investidores e profissionais sobre uma companhia. As opiniões podem afetar o mercado de ações e influenciar, para mais ou para menos, o preço de compra e venda. Através da análise de sentimentos é possível detectar opiniões positivas e negativas, o que ajuda os investidores na tomada de decisão (ALVES, 2016).

∙ Comentários Avaliativos: Sites de comércio eletrônico, filmes, séries, músicas, hotéis, per-mitem que usuários avaliem através de notas e comentários avaliativos (ZHANG, 2008). ∙ Política: Através da análise de sentimentos também é possível obter informações de

can-didatos políticos, aceitação após um debate, ou após assumir um cargo político (AFONSO et al., 2011).

3.2.3 Como pode ser aplicada

A análise de sentimentos é aplicada para identificar, extrair informações, como opiniões e sentimentos, em um grande volume de dados.

Oliveira e Bermejo (2017), aplicaram a analise de sentimentos em mídias sociais para gestão social e política.

(24)

Percebe-se que o panorama de mídias mudou muito nos últimos anos, pois antes pre-dominavam as mídias tradicionais (por exemplo, jornais, revistas e TV) e agora estão sendo complementadas ou substituídas por meios interativos de comunicação social (SOBKOWICZ; KASCHESKY; BOUCHARD, 2012). Com isso, a análise de sentimentos trouxe através de extra-ções das mídias sociais, o cenário da política em que as pessoas estão em discussão (OLIVEIRA; BERMEJO, 2017).

Leung (2009) utiliza análise de sentimentos para mostrar, em comentários avaliativos de produtos, é possível utilizar o resultado positivo ou negativo para apoiar um produto ou dar direcionamento de melhorias.

3.2.3.1 Como foi aplicada no contexto

Nesse trabalho, foi utilizado a análise de sentimentos em pequenos textos em comen-tários avaliativos de locais de hospedagem, com a finalidade de descobrir o conteúdo das infor-mações contidas nos comentários, identificando se são positivas ou negativas.

3.2.4 Opções de ferramentas

Para análise de sentimentos, existem várias ferramentas para utilizar. Esses métodos se diferenciam por suas técnicas de prognósticos de sentimentos, como o uso de abordagem de máquina, dicionários léxicos e processamento de linguagem natural. Algumas das ferramentas mais conhecidas na literatura são: SentiWordNet, PANAS-t, SenticNet, VADER, LIWC e Sen-tiStrength (BENEVENUTO; RIBEIRO; ARAÚJO, 2015).

∙ SentiWordNet - SentiWordNet é uma ferramenta de mineração de opinião baseada em dicionário léxico WordNet (MILLER, 1995). Esse dicionário agrupa verbos, adjetivos e outras classes gramaticais em conjuntos chamados synset. Com base nos termos encon-trados no WordNet, o SentiWordNet classifica uma polaridade para o texto em relação aos sentimentos, as classificações são: positivo, negativo e objetivo (neutro). A pontuação é obtida através de um método de aprendizagem de máquina semi-supervisionada, variando de 0 a 1 (ESULI; SEBASTIANI, 2006).

∙ SenticNet - SenticNet é um método para mineração de opinião e análise de sentimentos que explora técnicas de Inteligência Artificial e Web Semântica. O SenticNet tem como objetivo alcançar polaridade de textos em nível semântico. Utilizando técnicas de Pro-cessamento de Linguagem Natural para criar significados semânticos ou polaridade para mais de 14.000 conceitos. As polaridades de sentimentos variam de -1 até 1 (CAMBRIA et al., 2010).

(25)

∙ PANAS-t: Panas-t é uma ferramenta que consiste em uma versão adaptada do PANAS (GONÇALVES; BENEVENUTO; CHA, 2013), método utilizado em psicologia. O Panas-t consisPanas-te de senPanas-timenPanas-tos posiPanas-tivos e negaPanas-tivos, associa méPanas-todos: segurança, serenidade, surpresa, medo, tristeza, culpa, hostilidade, timidez, atenção e alegria.

∙ SentiStrength - O SentiStrength é um método de análise de sentimentos bastante conhe-cido que utiliza um dicionário léxico rotulado por humanos que é aprimorado por apren-dizado de máquina. É baseado em abordagens de aprenapren-dizado de máquina e classifica mensagens combinando métodos de classificação supervisionada e não-supervisionada (THELWALL, 2013).

∙ VADER - VADER (Valence Aware Dictionary for sEntiment Reasoning) é um método para análise de sentimentos desenvolvido para o contexto de mídias sociais online. VA-DER é um método de análise de sentimentos validado por humanos, desenvolvido com foco em avaliar mensagens no contexto do Twitter e outras mídias sociais, sem requerer treinamento. Dado o foco para mídias sociais, os autores desenvolveram técnicas para ir além do modelo de bag-of-words. Foram avaliados diversos pontos que envolvem senti-mentos excesso de pontuação, uso de letras maiúsculas, conjunções que invertem a pola-ridade do sentimento, dentre vários outros pontos sintáticos na mensagem.

∙ LIWC: LIWC (Linguistic Inquiry and Word Count) é uma ferramenta para análise de texto onde é analisado cada palavra contida no texto que estima componentes emocionais, cog-nitivos, baseando-se em um dicionário pré-definido pelo usuário. A avaliação consiste em tentar relacionar as palavras com pelo menos uma das categorias definidas. A ferramenta é comercializada e fornece funções otimizadas, como permissão para inclusão de dicio-nários personalizados (TAUSCZIK; PENNEBAKER, 2010).

3.3 COMENTÁRIOS AVALIATIVOS

Esta seção visa explicar a importância dos comentários avaliativos para a escolha dos consumidores de uma ferramenta.

Como cada plataforma trabalha com o recolhimento e exibição desses comentários. Sa-lientar também porquê existe a necessidade da comparação dos sentimentos presentes de forma geral nas avaliações de cada website.

3.3.1 Importância

Ye, Law e Gu (2009) afirmam que existem relações significantes entre os comentários avaliativos em um serviço de hospedagem e seu bom desempenho nos negócios. Isto faz bastante

(26)

sentido, afinal esse tipo de avaliação também pode ser considerado como um marketing boca a boca. E tal tipo de divulgação acaba sendo muito importante tanto para a ferramenta quanto para os que dependem dele, uma vez que influencia diretamente a opção do consumidor (FERREIRA et al., 2016).

Figura 5 – Comentário avaliativo na Amazon

3.3.2 Relação com os diferentes tipos de economia

Dada a importância já citada, independente do tipo de economia que a ferramenta tra-balha, é essencial que existam espaços de divulgação de opiniões dos usuários.

Apesar de ser importante para ambos os mercados, na economia compartilhada e prin-cipalmente no Airbnb, os comentários possuem um peso a mais, Fradkin et al. (2015) mostra que outras classificações, como nota em estrelas por exemplo são muito semelhantes entre as opções ofertadas para a grande maioria das cidades 96% dos locais possuem classificação entre 4,5 e 5 estrelas. No Couchsurfing, a segunda ferramenta de economia compartilhada explorada neste trabalho, não há classificação em número de estrelas ou alguma outra semelhante.

3.3.3 Comentários avaliativos nas ferramentas escolhidas

Nas ferramentas escolhidas os comentários avaliativos não são exibidos para os usuá-rios de maneira igual. No Booking.com os comentáusuá-rios são divididos em 3 partes: título, prós e contras. Nos capítulos subsequentes será explicado como foi solucionado o problema para que essa divisão não interferisse nos resultados. No Airbnb e no Couchsurfing não há essa divisão, o usuário pode escrever tudo o que deseja em um único texto.

(27)

Figura 6 – Comentário avaliativo no Booking.com

(28)
(29)

4 PASSOS METODOLÓGICOS

4.1 MINERAÇÃO E ARMAZENAMENTO DE DADOS

Para a realização do trabalho foi necessário coletar e armazenar informações de lugares, hotéis, como também dos hospedes e seus comentários avaliativos. Para ter acesso aos dados dos serviços de hospedagem, foi necessário identificar se os serviços de hospedagens possuíam API de consumo. Para os serviços que não possuíam API, foi necessário coletar as informações contidas na página, portanto, precisamos entender a estrutura dos dados contidos e desenvolver um Webcrawler capaz de buscar e coletar as informações.

O processamento dos dados é feito por meio de um algoritmo que trata as informações que são obtidas através de Webcrawler e da API e as armazena em um banco de dados estru-turado. Nesta estrutura estão presentes dados à respeito das cidades selecionadas, dos clientes, dos comentários, das respostas dadas aos comentários (caso a plataforma permita esse tipo de comunicação), entre outros dados que são possíveis de coletar que possuam relevância para o projeto.

Em uma visão geral, para a realização do trabalho foram coletado no total 763.790 comentários avaliativos das plataformas de hospedagem booking.com e Airbnb.com, sendo do total de avaliações 115.760 da plataforma de hospedagem Airbnb.com e 648.030 da plataforma de hospedagem booking.com. Nas coletas dos comentários avaliativos, foram coletados comen-tários de vários idiomas. Para o Booking.com, 266.239 dos comencomen-tários avaliativos são em por-tuguês e 381.791 em inglês. Já para o Airbnb.com foram coletados dos comentários avaliativos 35.810 em português, 69.952 em inglês, 6.786 em espanhol, 1.842 em francês e 1.370 avaliações em que não foram informados em qual idioma era o comentário avaliativo.

Para a realização do trabalho, foram considerados apenas os idiomas Inglês e português pela confiabilidade do dicionário fornecido da ferramenta para a análise de sentimento escolhida.

4.2 ESCOLHA DAS CIDADES

Buscando encontrar diferenças de acordo com a região de onde estavam sendo reali-zadas as avaliações, os resultados foram abertos para algumas cidades do Brasil e dos Estados Unidos da América. Para que as comparações pudessem fazer mais sentido, foram selecionadas cidades brasileiras e americanas que possuem características culturais semelhantes.

No Brasil, São Paulo, grande centro de negócios do Brasil (WANDERLEY, 2004), Rio de Janeiro - cidade com alto apelo turístico.(FREIRE-MEDEIROS; CASTRO, 2007) e Curitiba município com menos apelo turístico e de negócios que as anteriores.

(30)

As cidades dos EUA que possuem semelhanças com as brasileiras citadas anterior-mente são Nova Iorque, principal metrópole dos EUA (MAURICIO, 2009), Las Vegas destino de milhares de turistas todos os anos (WEAVER, 2011) e Boston, semelhante a Curitiba, possui sua importância para o seu país, porém não tem tanto apelo de negócios e turístico quanto as anteriores.

4.3 OBTENÇÃO DOS DADOS

4.3.1 Webcrawlersdo Booking e Couchsurfing

O Webcrawler também conhecido como Web Spider, Bots Scutter, Bot Crawler e Auto-matic Indexer, é um programa e/ou script focado para a World Wide Web (WWW). Um Webcra-wler é muito utilizado para atualizar bases de dados de motores de buscas, através das informa-ções que estão disponíveis nas páginas web publicadas, tais como links, palavras chaves, tags, entre outras. Além disso, um Webcrawler pode ser usado para manutenção de web sites, para validar código HTML e checar links (BAU et al., 2010). Podem também ser usados para obter tipos específicos de informações de páginas, como endereços de correio eletrônico de e-mails e criar cópias de páginas. Atualmente, também existem Webcrawlers para web semântica, a qual possui dados representados por um padrão e seguindo alguns princípios, como tornar as infor-mações mais legíveis e atribuir algum significado ou sentido à palavra informada pelos usuários (HEYDON; NAJORK, 1999).

Para desenvolver o Webcrawler para coleta de dados do Booking.com e do Couchsur-fing foi utilizada à linguagem Python, que possui eficientes estruturas de dados de alto-nível.

4.3.2 API Airbnb

API é definido como um conjunto de funções que facilitam a troca de mensagens entre dois ou mais sistemas distintos.(FERREIRA et al., 2016). Para Fraga (2010), o termo API é uma interface projetada por um sistema com o objetivo de permitir que outros sistemas possam inte-ragir com eles, possibilitando assim, sua comunicação. Podem-se definir API como um conjunto de operações encapsuladas e acessíveis por meio de protocolos pré-definidos. O conceito de API se aproxima mais de bibliotecas computacionais, que são arquivos que contêm um conjunto de funções pré-definidas e são chamadas quando necessário. Geralmente API são usadas para faci-litar o desenvolvimento de software, onde o desenvolvedor abstrai grande parte da complexidade de desenvolvimento.

(31)

hospedagem Airbnb.com. Para ter acesso à API foi necessário ter credenciais cadastradas, foram utilizadas as credenciais próprias para coleta de dados. Foi utilizada à linguagem PHP, que possuí uma eficiente estrutura de dados e uma simples e efetiva abordagem para programação orientada a objetos.

4.4 ARMAZENAMENTO DOS DADOS

Com o grande avanço em volume de dados, a maneira de armazená-los tem sido cada vez mais importante. No passado, os dados eram requeridos apenas localmente. Hoje, além da quantidade e tamanho dos dados, existe a necessidade de acessá-los de qualquer lugar e de qualquer dispositivo (DELCASTANHER; COSTA et al., 2004). Com isso, existem algumas formas para armazenamento de dados como: bancos de dados estruturados e não estruturados.

Nesse trabalho adotou-se um banco de dados estruturado. O Banco de dados escolhido foi o MySQL.

A tabela a seguir sumariza os dados armazenados.

Tabela 1 – Estatísticas básicas dos dados para cada plataforma considerada.

# de

acomoda-ções

# de comentários

Booking

880

648.030

Airbnb

6.332

115.760

CouchSurfing

963

8.589

4.4.1 Escolha da ferramenta

A ferramenta escolhida para a realização do trabalho foi a SentiStrength. A escolha foi feita pela melhor precisão entre as ferramentas para análise de sentimentos para textos Web (ABBASI; HASSAN; DHAR, 2014). O Sentistrength foi treinado com pequenos textos de Web Socialcomo Twitter.

A tabela a seguir exemplifica como o Sentistrength avalia e atribui a nota para diferentes comentários.

(32)

Tabela 2 – Exemplos de comentários e força da polaridade do sentimento associada. Polaridade

de senti-mento

Comentário

-4 As acomodações do quarto são terríveis, velhas e desconfortáveis. O sofá de plástico da sala é horrível. Não foi noticiado no Booking que a piscina estava em reforma (escolhemos o hotel por causa da piscina) e a informação que o custo da academia é extra também nos pegou de surpresa. Jamais ficaremos nesse hotel novamente.

-3 Experiência desagradável. O hotel é horrível, não gostamos e não pretendemos voltar mais! -2 Por erro do hotel não foi providenciada cama extra para meu filho de 4 anos; eu e meu marido tivemos

que unir 2 camas "viúvo"para ele dormir conosco, pois quando solicitamos à recepção que o fizesse, nos disseram não ser possível.

-1 A sauna não estava funcionando (se diz em reforma há mais de 5 meses) e a piscina poderia ser maior, além de aquecida.

0 Apartamento como descrito nas fotos. Próximo ao metrô e de um supermercado que possui tudo. 1 O João foi sempre atencioso conosco, a Sheila que nos recepcionou no apartamento também sempre

prestativa.

2 O Apartamento é exatamente como está nas fotos. Bem confortável e limpo. Está localizado numa ótima região. A portaria é muito simpática e o Marcelo muito prestativo.

3 Gostei muito do apartamento. Tudo muito bem arrumado, limpo, organizado. Bem localizado, pró-ximo de supermercados, ônibus, pontos turísticos como a Lapa.

4 Foi tudo maravilhoso! Apartamento bem localizado e muito bom! Chris respondeu a todas as minhas dúvidas, foi bem prestativo!

(33)

5 RESULTADOS

Nesta seção são apresentados os resultados do presente trabalho, o que as comparações mostram, o que as diferenças querem dizer, como esses resultados podem influenciar a escolha de um possível consumidor.

5.1 COMPARAÇÕES DOS SENTIMENTOS - DADOS AGREGADOS

Os resultados das análises de sentimentos executadas nos datasets mostram que, de ma-neira geral, as ferramentas de economia compartilhada possuem uma quantidade de comentários com polaridade positiva maior quando comparadas com a de economia formal, o que pode ser visto no gráfico (figura 10) a seguir.

O eixo X representa a polaridade do sentimento identificado para um determinado co-mentário e o eixo Y representa a porcentagem de coco-mentários atribuídos a cada polaridade.

Figura 10 – Gráfico com a distribuição dos sentimentos entre todas as plataformas

(34)

Couch-surfing se concentram em grande maioria nas notas acimas de 0, ou seja sentimentos positivos, a distribuição do Booking.com fica com um percentual menor nas notas mais positivas e apresenta maior significância nas notas abaixo de 0 quando comparadas com as outras plataformas.

O resultado evidenciado na figura 10 mostra que o tipo de economia afeta o sentimento do consumidor em uma avaliação. Em Fradkin et al. (2015) alguns motivos para o positivismo, ou a falta de negatividade em um comentário avaliativo feito no Airbnb pode ser explicado por alguns pontos. A interação entre anfitrião e hóspede e a criação de um sentimento de empatia. O receio de receber uma réplica negativa ao comentário feito. O receio de prejudicar o anfitrião com uma avaliação ruim e afastar outros possíveis hóspedes, aqui também devido a empatia gerada na experiência.

Por se tratar de um negócio com relações semelhantes é possível replicar estes mes-mos motivos para explicar a positividade do Couchsurfing, que ainda tem a característica de ser gratuito, o que aumenta as percepções acima descritas.

Ainda em Fradkin et al. (2015) os autores verifica-se que, no Airbnb, quando um con-sumidor não fica satisfeito com sua experiência ele tende a não escrever um comentário ao invés de avaliar negativamente o local. O que também é explicado pelos pontos supracitados.

No Booking.com como os anfitriões são empresas, hotéis muitas vezes renomados, essa sensação de proximidade entre provedor e consumidor de serviço acaba não ocorrendo, o que explica a maior negatividade, ou falta de positividade quando comparado ao Airbnb e ao Couchsurfing.

5.2 COMPARAÇÕES DOS SENTIMENTOS - DADOS DESAGREGADOS

Após a verificação feita na seção anterior, agora é necessário verificar se os dados quando desagregados continuam apresentando o mesmo resultado.

(35)

5.2.1 Países

Figura 11 – Distribuição dos sentimentos - Brasil

Figura 12 – Distribuição dos sentimentos - EUA

Na comparação dos gráficos acima, é possível afirmar que o país não possui influência com relação ao teor dos comentários nas plataformas. A mesma percepção de maior positivi-dade nas empresas que atuam na economia compartilhada também é vista quando separamos os resultados por país.

(36)

5.2.2 Cidades

Figura 13 – Distribuição dos sentimentos - São Paulo

(37)

Figura 15 – Distribuição dos sentimentos - Rio de Janeiro

(38)

Figura 17 – Distribuição dos sentimentos - Curitiba

Figura 18 – Distribuição dos sentimentos - Boston

Como pode ser observado nos gráficos acima, a desgregação dos resultados não altera o que foi verificado anteriormente.

Em todas as cidades a concentração dos comentários do Airbnb e do Couchsurfing é maior nas polaridades positivas. Enquanto o Booking em nenhum dos gráficos apresenta o mesmo comportamento. O representante da economia formal possui maiores porcentagens nas polaridades negativas e menores porcentagens nas polaridades positivas, quando comparado aos representantes da economia formal.

(39)

5.3 COMPARAÇÃO ENTRE QUANTIDADE DE COMENTÁRIOS E POLARIDADE MÉ-DIA

Para verificar se a quantidade de comentários de um local interfere nos resultados das análises feitas, também foi feita a comparação do número de comentários de um local com a média de polaridade dos sentimentos.

Os tipos de acomodações foram agrupados de acordo com o número de comentários, até 9 comentários (pouco popular), de 10 a 99 comentários (razoavelmente popular), acima de 100 comentários (muito popular), como pode ser visto na figura 19.

Figura 19 – Relação entre quantidade de comentários e polaridade dos sentimentos

O resultado apresentado pela figura acima sugere que a popularidade de um estabele-cimento não parece ter influência significativa na opinião dos usuários, pois os resultados para diferentes grupos de acomodações, de acordo com a sua popularidade não variaram considera-velmente. Isso indica que os resultados observados não são afetados pela popularidade do local.

5.4 CONTEÚDO DOS COMENTÁRIOS NEGATIVOS

Nesta seção investigamos os assuntos mais abordados pelos usuários nos comentários negativos. Optou-se por o foco em comentários negativos porque a nossa suspeita é de que, além de mais raros, eles tendem a não ser muito informativos nas plataformas de hospedagem da eco-nomia compartilhada. Para realizar essa análise utilizamos a técnica Latent Dirichlet Allocation (LDA), que é uma técnica popular para modelagem de tópicos em conteúdo textual (BLEI; NG; JORDAN, 2003).

(40)

A modelagem de tópicos é um método para classificação não supervisionada de docu-mentos semelhante ao agrupamento em dados numéricos. No nosso contexto, docudocu-mentos são comentários avaliativos, contendo palavras diversas. Particularmente, o LDA trata cada docu-mento como uma mistura de tópicos. Isso permite que os docudocu-mentos "se sobreponham"uns aos outros em termos de conteúdo, em vez de serem separados em grupos distintos, de forma a espelhar o uso típico da linguagem natural. Por exemplo, em um modelo de dois tópicos, pode-se dizer que o Comentário 1 é 85% tópico X e 15% tópico Y, enquanto Comentário 2 é 40% tópico X e 60% tópico Y. Além disso, o LDA trata cada tópico como uma mistura de palavras. Assim, em um modelo de dois tópicos sobre acomodações, por exemplo, com um tópico para "quarto"e outro para "café da manhã". As palavras mais comuns no tópico Quarto podem ser "cama", "lençol"e "barulho". Enquanto o tópico Café da manhã pode ser composto de palavras como "comida", "café"e "suco". É importante ressaltar que as palavras podem ser compartilha-das entre os tópicos; uma palavra como "ambiente"pode aparecer em ambos os tópicos (BLEI; NG; JORDAN, 2003; SILGE; ROBINSON, 2017).

Antes da identificação de tópicos, foi realizado um pré-processamento nos comentá-rios. Removendo URLs e caracteres especiais, espaços em branco desnecessários, pontuações, números, stopwords e transformou-se a palavra na sua raiz (stemming). Após esse processo, com o auxílio do LDA, identificamos 10 tópicos para os comentários negativos (polaridade -4 a -1) expressados no Airbnb e Booking. As Tabelas 3 e 4 apresentam as sete palavras que melhor descrevem cada um dos tópicos, tanto nos comentários em inglês quanto nos escritos em portu-guês. Podemos notar que todos os tópicos para o Booking são negativos. Por exemplo, na Tabela 3 o Tópico 1 é relacionado a reclamações com relação à problemas estruturais de hotéis em ge-ral, já o Tópico 2 é especificamente sobre o banheiro. No entanto, ao analisar os tópicos para o Airbnb, podemos identificar vários tópicos que sugerem sentimentos positivos, todos os marca-dos em negrito e com "**"na tabela. Por exemplo, o Tópico 6 sugere estar relacionado com a acomodação de forma geral, onde comentários indicam que os usuários aprovaram a estadia.

Nota-se também que os resultados tanto em inglês quanto em português seguem o mesmo padrão de resultados.

(41)

Tabela 3 – Dez tópicos latentes dos comentários negativos observados no Booking e Airbnb. (Português)

Tópicos para o Booking

1 2 3 4 5 6 7 8 9 10

hotel banheiro quarto nao pouco ruim mal falta barulho quarto nada limpeza cheiro dia estacionamento condicionado atendimento chuveiro rua cama

elevador box velho check ser wifi cafe toalha noit roupa

todo porta corredor reserva ter internet manha tudo andar travesseiro velho sujo mofo hora poderia fraco restaurant piscina outro casal reforma vazamento pequeno pessoa caro barulhento equip banho lado solteiro problema desejar apartamento poi achei antigo problema frigobar durant pequena

Tópicos para o Airbnb

1 2** 3 4 5 6 7** 8** 9 10

apart certeza apartamento breve pena tudo bem voltar estadia recomendo veri apartamento excel espero todo recomendo sujo voltaremo recomendo algun local sempr problema simpl vale excel cama rio novament valeu alugar pena piscina ficar tudo novo certo apartamento medo obrigada obrigado banheiro reali hora aconcheg vale pode casa otimo nao realment dia best voltarei pessoa total never banheiro bom expectativa nao limpeza ficar perfeito otima funcionando anunciado cama atencioso tudo

Tabela 4 – Dez tópicos latentes dos comentários negativos observados no Booking e Airbnb. (Inglês)

Tópicos para o Booking

1 2 3 4 5 6 7 8 9 10

night room room hotel desk staff check breakfast bathroom charg door work bed stay ask rude get poor dirti book nois shower smell place front even time wifi clean pay sleep water small will call servic elev expens old day floor didnt smoke never told help wait coffe need hotel next air uncomfort much back bad park pool look price close small view better day recept hour servic floor use

Tópicos para o Airbnb

1 2** 3 4 5 6 7** 8** 9 10

check good clean airbnb apart hous place locat day room get nice use host night everyth stay walk arriv bed door like bathroom didnt can time great close host one time just shower issu new home recommend area reserv bedroom work realli dirti book nois will worri park cancel two even also water guest floor need clean minut post sleep back thing towel stay access help want street autom live

O algoritmo LDA não foi aplicado para os comentários do Couchsurfing pois seu con-teúdo é muito semelhante as avaliações do Airbnb.

5.5 ANÁLISE DOS RESULTADOS

Os resultados obtidos evidenciam que, na economia compartilhada, a presença de co-mentários negativos é bem reduzida, quando comparados os números com o representante da

(42)

economia formal. O que dificulta a percepção dos usuários a respeito da qualidade de um de-terminado local. Avaliações neutras, devem ser levadas em conta no momento da decisão de escolha, são essas avaliações sem muito peso positivo que acabam fazendo a diferença para classificar um local como bom ou ruim.

(43)

6 PESQUISA ENTRE USUÁRIOS

Para avaliar se realmente utilizar o score desenvolvido, foi feita uma pesquisa com 30 pessoas, aonde elas tinham que avaliar, apenas a partir dos comentários avaliativos feitos por outros usuários, onde o local se encaixaria em uma escala entre 0 e 5, sendo 0 ruim e 5 excelente. Ao todo, 4 locais estavam sendo avaliados, essas acomodações foram escolhidas a par-tir do score descrito acima. A base de locais foi dividida em quartis de acordo com uma nota atribuída a cada local (o cálculo dessa nota é explicado na seção 7.2) e um local aleatório de cada quartil foi escolhido. A divisão ficou:

∙ Local muito bom; ∙ Local bom; ∙ Local ruim; ∙ Local muito ruim;

6.1 METODOLOGIA DA PESQUISA ENTRE OS USUÁRIOS

Para a pesquisa foi criado um formulário onde, após um pequeno texto contextualizador, o respondente deveria ler os comentários do local e então atribuir a nota a esta acomodação.

A pesquisa foi divulgada aleatoriamente, sem a escolha e definição de perfis específicos de respondentes.

No formulário a ordem dos locais era: 1. Local muito bom;

2. Local ruim; 3. Local muito ruim; 4. Local bom;

Essa ordem visou diminuir algum viés que a ordem dos locais poderia trazer na per-cepção dos respondentes.

6.2 RESULTADOS

(44)

Tabela 5 – Resultados do experimento com usuários, contendo a média de nota atribuída pelos voluntários para cada local

Local Média das Notas (I.C. 95%) Local muito bom 4, 8 (±0, 15)

Local bom 4 (±0, 31)

Local ruim 4, 6 (±0, 24)

Local muito ruim 3, 4 (±0, 4)

A tabela acima evidencia que apesar de estar no quartil dos piores, o Local 3 (muito ruim) ainda ficou com uma avaliação média/boa na visão dos respondentes. Mostrando que, na economia compartilhada e mais especificamente no Airbnb, locais com avaliações neutras devem ser considerados locais não recomendados. Outro ponto que reforça essa análise foi o fato de o local classificado como ’ruim’ terminar com uma média superior quando comparado ao local ’bom’. A percepção de qualidade através de comentários no Airbnb é dificultosa.

(45)

7 PROPOSTA NOVA LISTAGEM AIRBNB

Após a discriminação dos resultados e das respostas dos usuários nas pesquisas, é ne-cessário um olhar sobre as consequências à respeito de seus significados. A maior positividade do Airbnb e do Couchsurfing pode ser prejudicial para os consumidores, afinal anfitriões ruins podem não ficar evidenciados.

Más experiências não compartilhadas acabam gerando dificuldade na escolha e podem levar o usuário da ferramenta para um caminho errado, ou seja, preterir um local bom devido à ambiguidade dos sentimentos presentes nos comentários.

7.1 POR QUE ANALISAR ALÉM DAS ESTRELAS

Visando explicar o porquê da avaliação em formato de estrelas não estar sendo usada para auxiliar no estudo, nos apoiamos nas verificações feitas por (FRADKIN et al., 2015).

No Airbnb além do comentário de usuários também avaliam utilizando uma nota em formato de estrelas que vai de 1 a 5, porém 94% das notas variam entre 4.5 e 5 estrelas (FRAD-KIN et al., 2015). Isso faz com que essa classificação de estrelas não seja uma métrica suficiente para que uma análise sobre a qualidade de um local seja feita de maneira adequada.

7.2 NOTA PARA A NOVA CLASSIFICAÇÃO DE LOCAIS

Com base nos fatos descritos, foi criada uma equação matemática para que, a partir da polaridade média e da quantidade de comentários de um local, uma nota fosse atribuída e assim as prioridades dos locais exibidos em uma busca por cidade, por exemplo, fossem mais adequadas para auxiliar na escolha do usuário.

7.2.1 Construção da equação

Visando criar uma possível solução para o problema verificado, foi necessário o desen-volvimento de uma equação para atribuir uma nota a cada local e assim poder ordená-los de uma forma que levasse em conta a polaridade média dos comentários.

A primeira tentativa de atribuição da nota, levava em conta, adicionar 4 a média da polaridade calculada e depois elevar esse valor ao quadrado. Concluindo a primeira tentativa

(46)

com a fórmula:

(4 + 𝑃 )2 (7.1)

Onde:

𝑃 = Média da polaridade dos comentários do local

O objetivo desse cálculo, é evidenciar a distância entre cada polaridade. Por exemplo a antiga escala que era composta entre -4 e +4, agora inicia em 1 e vai até 64. Dessa maneira foi possível distinguir de forma clara um local com polaridade média +2 de uma outra acomodação onde o valor é +3.

Porém esse cálculo não leva em conta a quantidade de comentários que um local tem. Sem levar em conta esse número, a equação mostra resultados injustos, afinal uma acomodação com apenas 1 comentário com polaridade +4, possui a mesma pontuação de um local com média de polaridade +4, porém com 10 comentários.

Obviamente, um local com 10 comentários e média de polaridade +4 possui mais rele-vância do que um local com apenas 1 comentário com o mesmo valor de sentimento. Isto posto, é necessário inserir na fórmula, a quantidade de comentários, como critério de desempate.

Visando evidenciar o peso da nota na polaridade dos comentários e realmente o valor da quantidade de comentários ser apenas fator de desempate a maneira escolhida foi aplicar logaritmo no número de avalições.

Finalmente, a equação ficou definida da seguinte forma:

(log 𝐶) + (4 + 𝑃 )2 (7.2)

Onde:

𝑃 = Média da polaridade dos comentários do local 𝐶 = Quantidade de comentários do local

Esse cálculo visa ser justo na nova proposta de classificação. Ao levar em conta a quan-tidade de comentários, é possível distinguir se os locais têm ou não um número de comentários suficiente para uma avaliação.

Para cada local do Airbnb coletado, foi atribuído uma nota obtida a partir da equação supracitada. Na base estudada, os valores variaram entre 10 e 64. A tabela a seguir mostra alguns exemplos de como cada variável impactou no score.

(47)

Tabela 6 – Exemplos de cálculo da nota baseado nos comentários e polaridade # Comentários Polaridade média dos sentimentos Nota

2 4 64.69315 8 3 51.07944 3 3 50.09861 19 2.8333 49.63843 40 2.0938 40.82328 26 1.913 38.22167 2 1.5 30.94315 11 0.2 20.0379 3 -1 10.09861

(48)

8 CONCLUSÃO

O desenvolvimento do presente estudo possibilitou uma análise de como comentários avaliativos se comportam de maneira distinta quando comparamos ferramentas de economia for-mal e economia compartilhada. A avaliação desses comentários por parte de quem busca algum local para ir, como é o exemplo do Airbnb deve ser feito de uma maneira distinta. É necessário avaliar o nível da positividade dos comentários. Locais com muitos comentários neutros tendem a ser os piores, quando comparados àqueles que possuem muitos elogios com palavras extrema-mente positivas. Esse cuidado não é necessário no Booking, afinal as polaridades evidenciam que os comentários negativos são de fato feitos com palavras que expõe claramente sentimentos ruins.

Através de coleta de dados utilizando API e webcrawler, e aplicação da ferramenta de análise de sentimentos - Sentistrength, foi possível verificar padrões semelhantes entre as plataformas de economia compartilhada Airbnb e Couchsurfing, onde a polaridade média dos comentários era bem mais alta que a mesma taxa vista no Booking, representante da economia formal.

A partir da dificuldade de distinguir locais bons e ruins, foi criado uma nota, que, le-vando em conta a polaridade média dos comentários e a quantidade de comentários desse local atribuía um valor para cada uma dessas acomodações.

Dividindo a base com a aplicação de quartil e selecionando um exemplo de cada quartil, foi elaborada uma pesquisa visando apurar os resultados obtidos entre indivíduos aleatórios.

A pesquisa foi respondida por 30 pessoas que deveriam analisar os comentários de um local e classificá-lo em uma escala de 0 a 5 sendo 0 ruim e 5 ótimo, comprovou o que foi visto nos resultados dos dados coletados. Os locais piores avaliados no Airbnb passam uma percepção de serem medianos e não ruins de fato.

8.1 TRABALHOS FUTUROS

Como possíveis trabalhos futuros, pode-se apontar:

∙ Verificação do sentimento da resposta do anfitrião em relação ao comentário feito pelo usuário no Airbnb. O intuito é identificar se há algum tipo de relação entre os sentimentos dos dois comentários.

∙ Aumentar os níveis de detalhe das comparações, por exemplo nacionalidade, sexo, época do ano. Verificar se existe algum padrão de sentimento presentes de acordo com cada filtro. ∙ Expansão da comparação para ferramentas de outros nichos de mercado, como transporte,

(49)

fazendo uma comparação entre Uber/Cabify x Táxi.

∙ Criação de um sistema que, de acordo com filtros definidos escolha a melhor opção para o consumidor a partir dos sentimentos de um local.

Referências

Documentos relacionados

Mineração de conhecimento interativa em níveis diferentes de abstração: Como é  difícil  prever  o  que  exatamente  pode  ser  descoberto  de  um  banco 

(14) use um método de escrileitura calcado na vontade lúcida de estruturar o texto e não na intenção (absurda) de formular juízos de valor; ou seja, não organize o

O predomínio na sub-bacia de uso com pastagens degradadas, fases de relevo principalmente fortemente onduladas e onduladas, e manejo incorreto do solo, são as

Os maiores coeficientes da razão área/perímetro são das edificações Kanimbambo (12,75) e Barão do Rio Branco (10,22) ou seja possuem uma maior área por unidade de

• Os municípios provavelmente não utilizam a análise dos dados para orientar o planejamento de suas ações;. • Há grande potencialidade na análise dos micro dados do Sisvan

Médias seguidas da mesma letra minúscula, em cada agrupamento de colunas, não diferem entre si pelo teste de Tukey 5% de probabilidade.. Médias mm do teste de comprimento das

Objetivo: Garantir estimativas mais realistas e precisas para o projeto, ao considerar nesta estimativa o esforço necessário (em horas ou percentual do projeto) para

Nas leituras de falhas efetuadas, foram obtidos códigos de anomalia por meio de dois diferentes protocolos de comunicação: o ISO 14230 KWP (2000) e o ISO 15765-4 CAN. A seguir, no