• Nenhum resultado encontrado

​Este Algoritmo Analisa os Sentimentos por Trás dos Textões da Internet

N/A
N/A
Protected

Academic year: 2023

Share "​Este Algoritmo Analisa os Sentimentos por Trás dos Textões da Internet"

Copied!
10
0
0

Texto

(1)

Este Algoritmo Analisa os

Sentimentos por Trás dos Textões da Internet

Escrito por

31 August 2015 // 09:49 PM CET

GUILHERME ROSA

Uber ou táxi, ciclovia ou carro, vestido azul ou dourado. Nos últimos tempos, as principais tretas deixaram de ser discutidas ao redor das mesas de bar e migraram para as redes sociais. É no ambiente virtual que está o mapa da mina para sociólogos, publicitários e jornalistas estudarem as tendências em ebulição no país: desde quem sairá vencedor das eleições até quais as chances de sucesso de um novo produto lançado no mercado.

(/PT_BR?TRK_SOURCE=HEADER-LOGO)

THE   CHANNELS PT

(2)

Mas, na era dos textões, haja trabalho — e saco — para ler cada opinião divulgada nas nossas timelines. Para fazer esse trampo chato, pesquisadores de todo o planeta têm se focado no desenvolvimento dos websensors, algoritmos capazes de acompanhar o desenrolar de qualquer assunto que estiver sendo debatido online, em tempo real, e classificar as respostas dos usuários. “É impossível acompanharmos tudo que é postado.

Esse tipo de programa nos dá condições de monitorar isso”, diz Solange Oliveira Rezende, professora do Instituto de Ciências Matemáticas e de Computação da USP, que desenvolve desse tipo de tecnologia.

O foco das pesquisas de sua equipe é criar websensors ainda mais rápidos que os que estão no mercado. “Precisamos de algoritmos mais potentes para acompanhar o imenso — e cada vez maior — volume de dados gerado em redes sociais como Twitter e Facebook”, diz

Solange. O Motherboard teve acesso a um desses algoritmos e o usou para analisar a opinião do pessoal acerca de umas polêmicas que cobrimos recentemente.

O que faz o algoritmo desenvolvido por Rossi ter melhor desempenho do que os outros é levar em

conta não só a frequência com que as palavras aparecem nos textos, mas também as relações

que elas têm entre si

O programa testado foi desenvolvido por Rafael Rossi durante sua pesquisa de doutorado orientada por Solange. Trata-se de um algoritmo de aprendizado de máquina, que pode ser treinado para analisar qualquer texto apresentado pelo pesquisador e classificá-lo segundo seu conteúdo. “Esse tipo de algoritmo tem uma infinidade de usos, já que pode aprender a executar qualquer tipo de classificação”, diz Rossi.

Basta ao pesquisador fornecer alguns exemplos de textos que já estejam rotulados em diferentes categorias, como, por exemplo, notícias de esporte, entretenimento e política.

Num processo semelhante ao aprendizado humano, a máquina analisa os textos, vê quais as principais características de cada uma das diferentes categorias e aprende a classificar

qualquer outro texto que seja apresentado.

(3)

Para testar o algoritmo, realizamos o que os pesquisadores chamam de uma análise de sentimentos, um método que examina o conteúdo dos textos em busca da posição

defendida pelo autor. Ele foi usado pelo pesquisador durante as eleições passadas para ver se os usuários de redes sociais estavam postando de maneira favorável ou contrária a Aécio e Dilma.

No primeiro teste, analisamos os comentários postados nas notícias do Motherboard (na gringa, sobretudo) sobre os hackers que invadiram e divulgaram dados de usuários do site de traição Ashley Madison. Primeiro treinamos a máquina com oito comentários que

defendiam a ação dos hackers ao dizer se tratar de uma forma de justiça contra maridos infiéis e outros oito comentários que consideravam a ação um crime e uma ameaça à privacidade dos usuários (é importante lembrar que a coleta de dados não foi feita pelo pesquisador, mas por mim, o jornalista. Logo, foi feita sem rigor matemático ou critério científico).

Depois de a máquina aprender as características das mensagens de cada um dos lados, ela analisou outros 71 comentários. Em uma tabela, o algoritmo mostrou para que lado pendia cada um, apontando o grau de confiança que tinha nessa classificação. Por exemplo, o comentário “Hackers como esses podem ser nossos salvadores” foi classificado como defendendo a ação, com 95% de certeza. Como resultado geral, 56% dos comentaristas consideravam os hackers criminosos.

O segundo teste analisou a posição dos usuários do Twitter em relação à recente briga entre taxistas e Uber. Primeiro, treinamos a máquina com nove mensagens favoráveis a cada um dos lados da disputa. Em seguida, fizemos ela analisar outros 55 tuítes postados nas últimas semanas. Como resultado, 78% dos comentários defendiam o Uber — ou atacavam os

taxistas, o que era mais comum.

Além das análises de sentimentos, esse tipo de algoritmo já é bastante utilizado ao redor do mundo em uma série de outras aplicações. Eles são usados para catalogar bibliotecas

virtuais, organizar e-mails e documentos, criar filtros personalizados de busca, identificar autores de textos e até combater o cyberbullying. “Basta fornecer ao computador exemplos do que seriam comentários ofensivos e ele aprende a identificar esse tipo de

comportamento”, diz Rossi.

(4)

Hoje, com a quantidade cada vez maior de informação disponível na internet, esse tipo de performance se torna ainda mais necessária. Assim, mesmo que ninguém nunca curta, compartilhe ou comente quando você abre seu coração nas redes sociais, saiba que pelo menos uma máquina, alojada em algum laboratório pode estar te lendo — e até entendendo suas emoções. --

Os algoritmos são usados para catalogar bibliotecas virtuais, organizar e-mails e

documentos, criar filtros personalizados de busca, identificar autores de textos e até combater o

cyberbullying

O que faz o algoritmo desenvolvido por Rossi ter uma performance melhor do que os outros usados hoje em dia é o fato de ele levar em conta não só a frequência com que as palavras aparecem nos textos, mas também as relações que elas têm entre si. “O programa faz uma representação dos termos em rede. Por exemplo, se as palavras Futebol e Corinthians aparecem nos mesmos textos sobre Esporte, a máquina vai aprender que sempre que elas aparecerem juntas devem ter um peso maior para essa categoria”, diz.

Isso é especialmente importante para termos que podem ter mais de um sentido. Ainda no exemplo citado pelo pesquisador, São Paulo, Santos e Palmeiras poderiam tanto servir para identificar textos de esporte quanto urbanismo, teologia e botânica. Uma análise em rede, que interprete sua relação com outras as palavras do texto, pode prevenir esse tipo de confusão.

Em seus estudos, Rossi comparou a performance de seu algoritmo com outros já utilizados ao redor do planeta. O fato de analisar com base nas redes de termos fez com que o

pesquisador precisasse fornecer um número menor de exemplos já catalogados para o computador aprender a classificar. E, mesmo com o treinamento menor, o algoritmo se mostrou mais preciso na hora de classificar estudos científicos, páginas da internet,

documentos médicos e outros tipos de textos. “Ou seja, ele acerta mais e exige um esforço menor do pesquisador na hora de rotular os exemplos”, diz.

(5)

2 COMMENTS

(HTTP://MOTHERBOARD.VICE.COM/PT_BR/READ/ESTE­

ALGORITMO­ANALISA­OS­SENTIMENTOS­POR­TRAS­

DOS­TEXTOES#DISQUS_THREAD)

  GOOGLE PLUS

 TUMBLR  REDDIT

 STUMBLEUPON

Saque os Novos Produtos Apple que Você vai Poder Comprar em Breve (Se Quiser)

(/pt_br/read/saque-os-novos-produtos-apple- que-voc-vai-poder-comprar-em-breve-se-quiser?

trk_source=recommended)

Um Bate-Papo com a Mulher que Projetou e Imprimiu Seus Próprios “Saltos Hacker”

(/pt_br/read/um-bate-papo-com-a-mulher-que- projetou-seus-proprios-saltos-hacker?

trk_source=recommended)

TÓPICOS: análises semânticas (/pt_br/tag/an%C3%A1lises+sem%C3%A2nticas), Algoritmo (/pt_br/tag/Algoritmo), textão (/pt_br/tag/text%C3%A3o), facebook (/pt_br/tag/facebook), twitter (/pt_br/tag/twitter), comentários (/pt_br/tag/coment%C3%A1rios), polêmicas (/pt_br/tag/pol%C3%AAmicas), txts (/pt_br/tag/txts), textos (/pt_br/tag/textos)

RECOMENDADAS

COMPARTILHE

(/pt_br/read/saque-os-novos-produtos- apple-que-voc-vai-poder-comprar-em- breve-se-quiser?trk_source=recommended)

(/pt_br/read/um-bate-papo-com-a-mulher- que-projetou-seus-proprios-saltos-hacker?

trk_source=recommended)

(/pt_br/read/o-brasileiro-que-fundou-a- primeira-escola-de-realidade-virtual-do- mundo?trk_source=recommended)

(/pt_br/read/ronaldo-fenmeno-andando- de-segway-no-burning-man-prova-que-o- futuro-chegou?trk_source=recommended)

(6)

O Brasileiro que Fundou a Primeira Escola de Realidade Virtual do Mundo (/pt_br/read/o- brasileiro-que-fundou-a-primeira-escola-de- realidade-virtual-do-mundo?

trk_source=recommended)

Ronaldo Fenômeno Andando de Segway no Burning Man Prova que o Futuro Chegou (/pt_br/read/ronaldo-fenmeno-andando-de- segway-no-burning-man-prova-que-o-futuro- chegou?trk_source=recommended)

A Verdadeira História do Deboísmo: Como uma Crítica Feminista Virou um Meme Ruim

(/pt_br/read/deboismo-a-historia-de-um-meme- incompreendido?trk_source=recommended)

Como Seria Kanye West na Presidência dos Estados Unidos (/pt_br/read/kanye-west- presidente?trk_source=recommended)

(/pt_br/read/deboismo-a-historia-de-um- meme-incompreendido?

trk_source=recommended)

(/pt_br/read/kanye-west-presidente?

trk_source=recommended)

MAIS POPULARES

(7)

O Que Acontece Com Seu Cérebro Quando Você Joga Videogame Chapado (/pt_br/read/o-que- acontece-com-seu-cerebro-quando-voce-joga-videogame-chapado?trk_source=popular)

O YouTube Vai Pressionar as Gravadoras do Jeito que a Amazon Faz Com as Editoras

(/pt_br/read/youtube-vai-pressionar-gravadoras-do-jeito-que-a-amazon-faz-com-as-editoras?

trk_source=popular)

A Aposta Para Colonizar O Espaço Que Envolve Imprimir Humanos Em Outros Planetas (/pt_br/read/a-aposta-para-colonizar-o-espaco-que-envolve-imprimir-humanos?

trk_source=popular)

(/pt_br/read/o-que-acontece-com-seu-cerebro-quando-voce-joga-videogame-chapado?

trk_source=popular)

(/pt_br/read/youtube-vai-pressionar-gravadoras-do-jeito-que-a-amazon-faz-com-as-editoras?

trk_source=popular)

(/pt_br/read/a-aposta-para-colonizar-o-espaco-que-envolve-imprimir-humanos?

trk_source=popular)

(8)

A Água-Viva que Guarda a Chave para a Imortalidade (/pt_br/read/a-agua-viva-que-guarda-a-chave- para-a-imortalidade?trk_source=popular)

Mesmo as Partes Mais Profundas do Oceano Estão Cheias de Lixo (/pt_br/read/mesmo-as-partes- mais-profundas-do-oceano-estao-cheias-de-lixo?trk_source=popular)

O Dentista Forense Que Está Ressuscitando Cadáveres Não-Identificados no México (/pt_br/read/o- dentista-forense-que-esta-ressuscitando-cadaveres-no-identificados-no-mexico?

trk_source=popular)

(/pt_br/read/a-agua-viva-que-guarda-a-chave-para-a-imortalidade?trk_source=popular)

(/pt_br/read/mesmo-as-partes-mais-profundas-do-oceano-estao-cheias-de-lixo?

trk_source=popular)

(/pt_br/read/o-dentista-forense-que-esta-ressuscitando-cadaveres-no-identificados-no- mexico?trk_source=popular)

(9)

COMENTÁRIOS

(10)

print

Começou a Onda de Processinhos Contra Usuários do Popcorn Time

3 comments • 7 days ago

João Pedro — Esses estúdios de Hollywood são tão deprimentes.

Este Horroroso Monstro Pré­Histórico Voltou aos Rios Ingleses

1 comment • 6 days ago

Papel AluMINION — Deve estar faltando comida pra alguém se propor a comer isso...

Este Homem Está Tentando Viver como uma Cabra

1 comment • a month ago

Abibi Gonzales — hahahaha!!! quero ver ele cagar em formato de bolinhas...

Deboísmo: A História de um Meme Incompreendido

21 comments • 2 days ago

Joëlle­Marie Declercq — Oi Luiz tudo bom? Vi que você ativamente comentou sobre essa página no orkut, por isso fiz uma pequena

"atualização" aqui nos comentários mesmo:

ALSO ON MOTHERBOARDBR

2 Comments MotherboardBR

1  Login

 Share

Sort by Best

Join the discussion…

Reply JP Sousa   6 days ago

Link do artigo http://www.researchgate.net/pu...

△ ▽   

Reply corvolino   9 days ago

que algoritmo? lol

△ ▽   

WHAT'S THIS?

Subscribe

d Add Disqus to your site Privacy

 Recommend

Share ›

Share ›

© 2015 Vice Media Inc.

Sobre o Contato Política de privacidade Termos de uso

Referências

Documentos relacionados

sobre o mesmo valor presente (PV) pelo mesmo período (n) resultam no mesmo valor futuro (FV)..  Em regime de capitalização simples, também são

O capítulo segundo analisa em pormenor as redes sociais mais utilizadas em Portugal (Facebook, Youtube, Pinterest, Instagram, Twitter, Google+ e Linkedin). Este trabalho

Analisa todas as postagens dos perfis da revista nas redes sociais Facebook, Twitter e Instagram, desde sua criação, com os objetivos de descrever as

Processo nº 033/2013 – CPPG - Relatório Final do Curso de Especialização em MBA Executivo em Gerenciamento de Projetos (turma 02).. Armando Araújo de

Pessoas de todas as classes sociais possuem acesso a internet e contas em Redes Sociais como Orkut, Facebook e Twitter..  O Twitter possui 175 milhões de usuários registrados,

Os móveis, utensílios e equipamentos são de dimensões comerciais, não sendo parte integrante do contrato de aquisição do apartamento.. Os acabamentos são ilustrativos e devem

As redes sociais, como Orkut, Twitter, Facebook, Youtube, entre outras, são acessadas por um número casa vez maior de pessoas em diferentes partes do planeta; é uma forma rápida

Ao utilizar discos de corte diamantados deverá assegurar-se de que a seta do sentido de rotação sobre o disco de corte diamantado coincida com o sentido de rotação