Usuário como participante - AP ˆ ENDICE A A Evolução da Web

AP ˆ ENDICE A A Evoluc¸˜ao da Web

A.2.4 Usu´ario como participante

Segundo (O’REILLY, 2005), o principal fator de sucesso das organização que nasceram na era web1.0 e sobreviveram ao nascimento da era web2.0 foi acreditar no poder da web de potencializar a inteligência coletiva.

Inserir conteúdo na rede tornou-se mais fácil do que nunca. A publicacao de textos passou a ser uma tarefa de poucos minutos. Idem para compartilhar fotos na internet. Qualquer usuário, sem precisar de nenhum conhecimento além de utilizar o navegador de internet, passou a poder participar do conteúdo da internet.

Segundo (LERMAN, 2007), essa transformação aconteceu através do surgimento do que ela chama de sites de m´ıdias sociais, como blogs, wikis, Digg, Flickr e outros. Em geral, essas aplicações compartilham 4 caracter´ısticas: (1) os usuários criam conteúdos numa variedade de tipos de m´ıdias; (2) os usuários indicam etiquetas para o conteúdo; (3) os usuários avaliam os conteúdos ativamente através de votos, ou passivamente por simplesmente consumir conteúdos; (4) os usuários criam redes sociais, apontando outros usuários com interesses similares como contatos ou amigos.

Folksonomias

Folksonomia, do inglês, folksonomy, é a combinação de folk (povo) com taxonomy (taxono- mia). O termo denota o sistema de desenvolvimento de organização por metadados de conteúdo (MATHES, 2004). Nesse sistema, os usuários comuns, anexam etiquetas (tags) a algum tipo de conteúdo, como livros, fotos e s´ıtios. As etiquetas são usadas para classificar os conteúdos.

Um aspecto importante de uma folksonomia é que ela consiste de etiquetas que não possuem um hierarquia ou qualquer outro tipo de estrutra. O que existe é um processamento automático de identificação de etiquetas relacionadas, cujos conteúdos correspondentes são o mesmo(MATHES, 2004).

As folksonomias são um sintoma claro do aspecto participativo da web2.0. Os sistemas ondem existem folksonimias permitem que os usuários sejam responsáveis pela organização do conteúdo do s´ıtio.

A.2 A Web 2.0 103

Social Bookmarking websites

Uma função presente em praticamente todos os navegadores de internet, ou browsers, é a de permitir que o usuário adicione um determinado site a uma lista de sites favoritos. Essa lista de sites favoritos era armazenada no computador, e portanto, não pode ser facilmente acessada de um outro computador.

Esse fato inconveniente pode ser contornado utilizando, ao invés do sistema tradicional de organização de sites favoritos, os sites de Social Bookmarking. Esses sites permitem que os usuários criem contas, e adicionem favoritos à elas. Os usuários são encorajados à classificar os seus favoritos com etiquetas (tags).

O objetivo desta classificação consiste nomeadamente em facilitar a posterior recuperação da informação. Ao mesmo tempo, a utilização das tags traz vantagens ao n´ıvel da pesquisa, pois é poss´ıvel pesquisar quer nas nossas tags, quer nas tags dos outros utilizadores. Deste modo, podemos encontrar pessoas com os mesmos interesses e ”descobrir”novos sites relacionados com o mesmo assunto.

Blogs

Blog é uma página da web cujo conteúdo principal, composto por ”postagens”, é organi- zado cronologicamente de forma inversa, como em um diário. As postagens podem ou não pertencer ao mesmo assunto ou terem sido escritas pela mesma pessoa. Existe a possibilidade de discussão e troca de idéias através de um espaço reservado para comentários, que podem ser lidos e escritos por qualquer pessoa.

As páginas textuais dos blogs podem vir acompanhadas de imagens e sons, que geralmente são inseridos de forma fácil em meio aos textos, permitindo que usuários sem muito conhecimento das ferramentas possam também criar seus blogs.

Assim como nos ”social bookmarkings”, os posts dos blogs podem ser descritos por etiquetas. O objetivo dessa descrição é para que seja poss´ıvel que os leitores naveguem no blog através das etiquetas.

Todas as configurações de um blog são abertas à alteração do autor e de todos que ele auto- rizar. Pode-se alterar o nome, o endereço, a descrição, a forma de publicação, a periodicidade dos arquivos, a aparência visual da página, e ainda acoplar outras m´ıdias e ferramentas.

O próprio ambiente estimula a construção de conhecimentos necessários para realizar as alterações desejadas, tornando o usuário autor e organizador do seu próprio espaço. A comunicação através dos blogs se dá de forma ass´ıncrona e assim podem ser utilizados como um laboratório de escrita virtual onde todos os membros podem agir, interagir, trocar experiências sobre assuntos de mesmo interesse, gerando ambientes colaborativos.

Seria imposs´ıvel falar sobre a emergência do caráter participativo da web sem falar de Blog: Existem 13 milhões de blogs indexados por Technoratti desde 2002; 346 milhões de pessoas lêem blogs; 900 mil novos posts de blogs são criados por dia.

A.3 A Web 3.0

O termo web3.0, ao contrário do web2.0, ainda é muito contestado e muito pouco citado por autores - principalmente do meio acadêmico. Ele foi empregado pela primeira vez pelo

A.4 Conclus˜ao 105

jornalista John Markoff, num artigo do New York Times e logo incorporado e rejeitado com igual ardor pela comunidade virtual.

No entanto, a organização e uso de maneira mais inteligente de todo o conhecimento já dispon´ıvel na Internet é um fenômeno que não era notável quando da popularização da web2.0, e portanto, a criação de um novo termo para denotar uma nova era faz algum sentido.

A web atualmente possui terabytes de informações dispon´ıveis para seres-humanos, mas ileg´ıveis por computadores. Esse cenário motivou a transformação no paradigma de disponibilização de informações na web. Essa transformação diz respeito à web semântica, uma tecnologia que através de linguagens que estruturam os dados semanticamente, permite que as máquinas con- versem com outras máquinas de forma inteligente.

A infra-estrutura da Web Semântica é baseada em um modelo de dom´ınio denominado ontologia, que constitui a base formal dos espaços virtuais semânticos. O termo ontologia tem origem na filosofia grega, e é usado para designar a teoria a respeito da existência, sobre que tipos de coisas existem perante o mundo. Na Computação, o termo é usado para descrever os modelos do mundo, ou seja, descrever aquilo que pode ser representado computacionalmente sobre o mundo (F., 2005).

Segundo (BERNERS-LEE; HENDLER; LASSILA, 2001), de in´ıcio, a Web Semântica será formada por ”ilhas de conhecimento“, ou seja, nichos de conhecimento espec´ıficos para alguma aplicação mas que, através de interoperabilidade entre ontologias poderão interagir. Portanto, a consolidação da web semântica em toda a web, será um processo cont´ınuo e cooperativo entre aplicações especializadas em dom´ınios distintos.

A.4 Conclus˜ao

A web, desde sua concepção entrou em processo de transformação profunda. Seu caráter aberto e de abrangência mundial permite que centenas de milhões de pessoas contribuam nesse processo de transformação, para melhor atender às necessidade da comunidade de internautas do globo.

A compreensão da web e das tecnologias envolvidas é fundamental para o desenvolvimento de uma aplicação web - como a RSN. Mais do que isso, tal compreensão nos faz entender a origem dos conceitos consolidados atualmente, e nos indica caminhos para onde esses conceitos podem seguir. Este cap´ıtulo destacou os principais aspectos relacionados às três gerações da web, apontando tendências e auxiliando a compreensão da forma em que a web evolui.

107

AP ÊNDICE B -- Processamento das Recomendaç ões

na RSN

Um dos principais recursos propostos para a RSN foram as recomendações. Por este motivo, este trabalho apresenta além do cap´ıtulo sobre sistemas de recomendação, o apendice corrente, que apresenta as recomendações inclu´ıdas na RSN bem como suas respectivas implementações.

B.1 A Capa da RSN

A página inicial, ou a capa da RSN, apresenta, por padrão, uma lista de not´ıcias ordenadas por um critério que envolve a “idade” da not´ıcia e o número de votos que ela recebeu. Quanto antes a not´ıcia aparece nessa lista, maior destaque ela tem. Quanto mais votos uma not´ıcia recebeu, maior destaque ela tem, quanto mais “idade” a not´ıcia tem, menor destaque ela tem.

Tal ordenação sugere que essa lista seja uma recomendação, pois o critério adotado é tal que faz com que as not´ıcias que possuem maior probabilidade de serem interessantes para o usuário recebam maior destaque.

A implementação escolhida é simples. A tabela de Not´ıcias possui uma coluna chamada pontos. O valor dessa coluna é calculado periodicamente, através de um script, com o resultado de um calculo que envolve a quantidade de votos da not´ıcia com a “idade” da mesma. Na hora de exibir as not´ıcias, essa coluna “pontos” é utilizada como critério de ordenação.

Para isso, o script deve recuperar todas as not´ıcias, com seus respectivos números de votos e respectivas “idades”, e atualizar a coluna “pontos” de cada registro recuperado através de um cálculo que envolve uma constante, a “idade” e o número de votos da not´ıcia. A figura B.1 exibe o script desenvolvido.

Figura B.1: Script para atualizar pontuac¸˜ao das not´ıcias

B.2 Recomendac¸˜oes na Tela Ver Not´ıcia Completa

Na Tela Ver Not´ıcia Completa, o sistema exibe, além de uma not´ıcia completa, outras not´ıcias que tenham grande possibilidade de interessar ao leitor. Essa grande possibilidade é baseada no fato de que essas outras not´ıcias são as que mais receberam votos de pessoas que também votaram na not´ıcia em questão.

No cap´ıtulo 5, explica-se que a filtragem colaborativa, como mecanismo de recomendação pode ser dividido em três passos: encontrar usuários similares; criar a vizinhança; processar um prognóstico baseado nos vizinhos selecionados. As recomendações na Tela Ver Not´ıcia Com- pleta ignora os dois primeiros passos, e realiza o terceiro, utilizando o método de recomendação baseado em regras de associação de uma maneira simplificada.

Considerando Vi= {u1, u2, u3, ...} o conjunto de avaliac¸˜oes recebidas por uma not´ıcia i (em

nosso caso, o valor da avaliação é 1 caso tenha recebido voto e 0 caso não tenha recebido voto). Na tela ver not´ıcia completa onde a not´ıcia em questão é a not´ıcia i, as not´ıcias recomendadas serão aquelas em que o valor Vi∗ Vx forem maiores. Para exemplificar, vejamos a seguinte

B.3 Recomendac¸ ˜oes da tela Recomendadas 109

Tabela B.1: Votos de usu´arios em not´ıcias: x representa que o usu´ario da linha correspondente votou na not´ıcia da coluna correspondente.

Usu´ario / Not´ıcia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Marcos x x x x x x Let´ıcia x x x x x x Felipe x x x x x x Marcelo x x x x x x Carolina x x x x x

Por exemplo, de acordo com a situação da tabela, na tela ver not´ıcia onde a not´ıcia questão é a not´ıcia 3, a not´ıcia mais indicada para ser recomendada é a not´ıcia 5, pois V3∗ V5 =

{1, 0, 1, 1, 1} ∗ {1, 0, 1, 1, 0} = 3, e n˜ao h´a nenhuma outra not´ıcia x onde V3∗Vx≥ 3.

A implementação foi feita através de uma consulta SQL, mostrada na figura B.2., que recupera as 3 not´ıcias que possuem maior valor do produto interno de seu conjunto de avaliações com o conjunto de avaliações da not´ıcia em questão Vx.

Figura B.2: Consulta SQL para recurar not´ıcias a serem recomendadas

B.3 Recomendac¸˜oes da tela Recomendadas

Na tela ”Recomendadas”, o sistema exibe uma lista de not´ıcias recomendadas baseada em usuários de gostos similares (vizinhos) ao gosto do usuário em questão. Para gerar essa lista de not´ıcias recomendadas, o sistema executa os três passos da filtragem colaborativa como mecanismo de recomendação, descritos no cap´ıtulo 5.

O primeiro passo é realizado através de um script que calcula o valor das similaridades entre todos os usuários através do coeficiente do coseno. Esse script considera um vetor para cada

usuário de n posições, sendo n o número de not´ıcias registradas no sistema. O valor da posição i desse vetor, é 1, caso o usuário tenha votado na not´ıcia i e 0 caso contrário. Esse script, cujo trecho que calcula o coeficiente de similaridade entre dois vetores é mostrado na figura B.3, é executado periodicamente.

Figura B.3: Função PHP para calcular o coeficiente de similaridade entre 2 perfis de usuários

O segundo passo, escolher a vizinhança, é feito através do estabelecimento de um limiar de similaridade. O valor colocado como limiar foi 0.25, sendo que sua modificação pode ser realizada facilmente.

O terceiro passo, processor um prognóstico baseado nos vizinhos selecionados, foi consi- derar o conjunto de not´ıcias votadas pelos vizinhos, excluir desse conjunto as not´ıcias em que o usuário já votou, e exibir o conjunto resultante, por ordem decrescente da data de publicação. Esse processamento é realizado através da função na linguagem php, exibida na figura B.4, que recebe como parâmetros o usuário em questão, e o limiar de similaridade para determinação de vizinhos.

B.3 Recomendac¸ ˜oes da tela Recomendadas 111

Figura B.4: Func¸˜ao PHP que envolve uma consulta SQL que retorna not´ıcias “recomendadas por vizinhos”

No documento RSN - Rede Social de Notícias (páginas 103-113)