UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE ARTES E COMUNICAÇÃO DEPARTAMENTO DE CIÊNCIA DA INFORMAÇÃO CURSO DE GESTÃO DA INFORMAÇÃO

(1)

CENTRO DE ARTES E COMUNICAÇÃO

DEPARTAMENTO DE CIÊNCIA DA INFORMAÇÃO

CURSO DE GESTÃO DA INFORMAÇÃO

RODRIGO ROSSI LINCK

INDEXAÇÃO NO GOOGLE IMAGE LABELER

RECIFE

FEVEREIRO/2014

(2)

INDEXAÇÃO NO GOOGLE IMAGE LABELER

Trabalho de Conclusão apresentado ao Curso de Ciência da Informação, como requisito parcial para obtenção do grau de Bacharel em Gestão da Informação.

Orientador: Prof. Fábio Pinho

RECIFE

FEVEREIRO/2014

(3)

L736i Linck, Rodrigo Rossi

Indexação no Google image Labeler / Rodrigo Rossi Linck. – Recife: O Autor, 2014.

38 f.: il.

Orientador: Fábio de Assis Pinho.

Trabalho de Conclusão de Curso (Graduação) – Universidade Federal de Pernambuco. Centro de Artes e Comunicação. Ciência da Informação, 2014.

Inclui referências.

1. Indexação. 2. Interação homem-máquina. 3. Imagens, ilustrações, etc. como recursos de informação. 4. Recuperação da informação. I. Pinho, Fábio de Assis (Orientador). II.Titulo.

020 CDD (22.ed.) UFPE (CAC 2014-18)

(4)

(5)

Com os avanços da Tecnologia da Informação e das telecomunicações, a facilidade para captura, criação e distribuição de imagens em meio eletrônico vem crescendo e, consequentemente, aumenta de forma exponecial o numero de imagens digitais disponíveis na Internet. Porém o aumento da oferta e do acesso a essas imagens é acompanhado por uma necessidade de soluções para os problemas inerentes à sua descrição, particularmente nas questões relacionadas à indexação e recuperação. O objetivo deste trabalho é analisar o Google Image Labeler, como ferramenta de indexação em relação ao seu potencial de criação de rótulos para imagens e de sua interação com os usuários. Para isso utilizamos fontes documentais buscado configurar uma imagem dos resultados criados por este aplicativo, demostrando seus pontos fortes em relação à capacidade de geração de rótulos, do ponto de vista quantitativo e suas fragilidades como, por exemplo, a inexpressiva experiência social que proporciona. Baseadas nas análises são feitas sugestões da possibilidade de utilização de aplicativos similares ao Google Image Labeler como ferramentas auxiliares na indexação de repositórios de imagens.

PALAVRAS-CHAVE: Google Image Labeler. Indexação. Indexação social. Crowdsourcing.

(6)

With the advances in information technology and telecommunications the facility to capture, create and distribute images in electronic media are growing and so exponentially increases the number of digital images available on the Internet. But the increasing availability and access to these images is followed by a need for solutions to the problems inherent in its description, particularly on issues related to indexing and retrieval. The objective of this work is to analyze the Google Image Labeler as indexing tool in relation to its potential for creating image labels and its interaction with users. To achieve that we use documentary sources, trying to configure an image of the results created by this application, showing its strengths in relation to the ability of generate labels, from the point of view of quantity, and weaknesses as the poor social experience that the game provides. Finally, based on our analysis, we made some suggestions, concerning the possibility of using applications like Google Image Labeler as auxiliary tools in indexing image repositories.

(7)

Figura 1: Tela inicial do Google Image Labeler. 18

Figura 2: Tela do jogo Google Image Labeler. 19

Figura 3: Mensagem de JeremyL, retirada do Google Seo News and Discussion Forum. 28 Figura 4: Mensagem de TravelSite, retirada do Google Seo News and Discussion Forum. 28 Figura 5: Mensagem de mattg3, retirada do Google Seo News and Discussion Forum. 29 Figura 6: Mensagem de Kufu, retirada do Google Seo News and Discussion Forum. 29 Figura 7: Mensagem de SEOtop10, retirada do Google Seo News and Discussion Forum. 30 Figura 8: Mensagem de MamaDawg, retirada do Google Seo News and Discussion Forum. 30 Figura 9: Mensagem de Leosghost, retirada do Google Seo News and Discussion Forum. 31 Figura 10: Mensagem de thetrasher, retirada do Google Seo News and Discussion Forum. 31 Figura 11: Mensagem de whoisgregg, retirada do Google Seo News and Discussion Forum. 32

(8)

Gráfico 1: Comentários relacionados ao conceito do jogo. 25

Gráfico 2: Comentários relacionados à jogabilidade. 26

(9)

Introdução 8

Justificativa 10

Objetivos 11

1 Indexação 11

1.1 Indexação de Imagens 14

2 Crowdsourcing e Computação Humana 15

3 Análise do Google Image Labeler 17

3.1 Método de Pesquisa 17

3.2 Caracterização do Google Image Labeler 17

3.3 Análise dos Resultados do Google Image Labeler como Ferramenta de Indexação 22 3.4 Análise dos Usuários do Google Image Labeler

4 Discussão e contribuições 5 Considerações finais Referências 24 33 34 36

(10)

Introdução

A partir da explosão da informação gerada após a segunda guerra, que influenciou definitivamente a criação da Ciência da Informação como conhecemos hoje, a preocupação deste campo de conhecimento com o crescimento exponencial das informações disponíveis vem aumentando, porém principalmente com o advento da Internet e do protocolo HTTP, vimos os nossos recursos para analisar e lidar com esse universo, apesar dos avanços da tecnologia e talvez exatamente por causa destes, serem postos a prova até o ponto de se ter a impressão que não teremos recursos ou habilidade para gerir no futuro essa massa incomensurável de informação que se avoluma diariamente.

Nos ambientes controlados dos repositórios eletrônicos, como bibliotecas digitais e bases de dados, por exemplo, que como é sabido demandam um investimento em profissionais especializados e conseqüentemente amplos recursos financeiros, existem vários modelos de soluções estudadas e implementadas, que permitem tratamento e recuperação satisfatórios das informações. Porém estes tratam de documentos determinados de quantidade definida e pertinentes a um público alvo específico.

O aumento do acesso à equipamentos para captura de imagens (câmeras digitais, smatphones, scanners, multifuncionais), a redução de custo do armazenamento de dados e os avanços nas telecomunicações facilitando a distribuição de imagens através de redes de comunicação, tornam as imagens digitais cada vez mais disponíveis para um número crescente de pessoas.

Contudo o aumento da oferta e do acesso a essas imagens é acompanhado por uma necessidade de soluções para os problemas inerentes à sua descrição, particularmente nas questões relacionadas à indexação e recuperação.

Na verdade pouca informação está disponível sobre o porquê dos usuários procurarem imagens na Internet, como pretendem usá-las e como formulam suas consultas.

Os métodos de indexação de imagem de que dispomos são basicamente de dois tipos: baseados na indexação tradicional ou realizados por processos automatizados.

A indexação realizada por humanos é conceitual e utiliza vocabulários controlados ou da linguagem natural para expressar o que uma imagem é, ou do que trata. Tem a vantagem de

(11)

proporcionar uma análise mais profunda do conteúdo, mas sua implementação é dispendiosa e sofre com a falta de consistência devido à natureza subjetiva de interpretação de imagens.

A indexação por conteúdo, feita pela máquina, depende de uma interpretação em nível de pixel do conteúdo dos dados da imagem. É uma alternativa relativamente barata, porém fornece um baixo nível de interpretação da imagem e é relativamente eficiente apenas em coleções de domínios muito estreitos.

Uma terceira via para a indexação de grandes volumes de documentos, como é a realidade da Internet, é um fenômeno crescente e que vem sendo bastante estudado no âmbito da Ciência da Informação, conhecido como social tagging ou indexação social, além de vários outros termos encontrados na literarura como: folksonomias, ethnoclassification, collaborative tagging e social bookmarking, por exemplo. Ocorrendo em ambientes sociais online, compartilhados e abertos a indexação social possibilita uma modelagem onde as percepções dos próprios usuários sobre os documentos geram sua representação.

A indexação social nos leva a algumas questões interessantes do ponto de vista da psicologia cognitiva, das questões comportamentais como o envolvimento de grandes grupos de pessoas em esforços colaborativos com um objetivo comum e nos remete ao crowdsourcing, recurso utilizado cada vez mais no ambiente empresarial.

O termo crowdsourcing descreve o ato de tomar uma tarefa tradicionalmente realizada por um profissional dentro do ambiente da empresa ou mesmo terceirizado, para um grupo indefinido de pessoas que se envolvem na sua execução de forma colaborativa, podemos defini-lo como o uso de recursos coletivos num modelo de produção que utiliza a mão-de-obra e os conhecimentos de um grupo de indivíduos com interesses comuns, que se empenham em resolver problemas, criar conteúdo, soluções ou produtos.

Escolhemos neste trabalho analisar o Google Image Labeler do ponto de vista da indexação, por ser uma iniciativa associada à indexação social, que segundo acreditamos, reúne uma série de questões interessantes para serem levantadas tanto no que diz ao seu formato, quanto nos resultados de seus esforços de indexação e finalmente na sua interação com os usuários, indexadores involuntários nesse caso.

(12)

Justificativa

Acreditamos que a muito para ser explorado do ponto de vista da Ciência da Informação em relação aos novos processos de indexação que surgem, de forma espontânea, das novas relações dos usuários da informação com os documentos digitais e as tecnologias emergentes.

As iniciativas de indexação social, por exemplo, apesar de serem cada vez mais alvo de estudos por parte de autores da Ciência da Informação, são geradas ao largo desta e trazidas à sua luz num processo que é muito mais de análise a posteriori, do que propriamente participativo.

Esta posição relega os cientistas da informação ao papel muito mais de observadores dos fenômenos do que de agentes de mudança, no enfrentamento de questões importantes que se agigantam, como é o caso da problemática que envolve a indexação de documentos no ambiente da Web.

Acreditamos que ao estudar processos criados por outras áreas das ciências, para solução de problemas que são intrínsecos da Ciência da Informação, poderemos talvez enriquecer o diálogo entre diferentes domínios do conhecimento, praticando uma CI mais próxima de uma realidade multidisciplinar.

O Google Imagem Labeler objeto de estudo deste trabalho. Traz, segundo acreditamos, vieses conceituais, tecnológicos, sociais e comportamentais que podem permitir uma análise multidisciplinar e, esperamos, uma visão dos insights que conduzem aos avanços de que fazemos parte de uma forma ou de outra. Seja como agentes ou como observadores.

(13)

Objetivos

Objetivo Geral

Analisar o uso da indexação social e crowdsourcing na indexação de imagens no ambiente da Wide World Web através do aplicativo Google Imagem Labeler.

Objetivos Específicos

• Avaliar os resultados do Google Image Laberer como ferramenta de indexação colaborativa das imagens disponíveis na Internet.

• Analisar as relações dos usuários com o aplicativo Google Imagem Labeler.

1 Indexação

Tradicionalmente, a indexação de assuntos de documentos textuais tem sido responsabilidade de bibliotecários e indexadores profissionais. Na prática de indexação um especialista determina o significado de em documento atribuíndo a este, termos que descrevem seu conteúdo. Esta atividade depende normalmente da construção prévia de vocabulários controlados como tesauros ou esquemas de classificação. A indexação envolve ainda a identificação e representação do conteúdo informacional dos documentos utilizando sistemas de recuperação de informação descritivos e analíticos que permitem a um usuário obter informação relevante referente às suas necessidades. Para haver a recuperação partimos do princípio que o indexador humano é capaz de decodificar o documento e construir uma representação significativa de seu conteúdo informacional, utilizando regras e convenções de indexação e códigos de catalogação.

Esta abordagem clássica para indexação de assuntos se baseia na suposição de que documentos de informação têm significados estáveis, que o perito treinado é capaz de decodificar e que serão universalmente aceitos como constituindo o significado informacional do documento. Neste quadro

(14)

teórico, o significado de documentos de informação é localizado no documento e questões sobre a interpretação do usuário da informação permanecem relativamente inexploradas. A indexação realizada por especialistas depende da existência de vocabulários controlados, esquemas de classificação, taxonomias ou ontologias. Baseia-se na gestão da informação através da intervenção de intermediários (bibliotecários, indexadores, editores voluntários) sendo assim um processo caro e demorado. E ainda que possa ser um facilitador do acesso à informação, gerando acesso a grandes coleções de documentos, pode por outro lado inibir a recuperação das informações, pois para atingir a precisão se utiliza de vocabulários restritos tendendo a ignorar ou marginalizar outras visões de mundo, negligenciando conjuntos de termos e conceitos. (BERNAN, 1993).

A organização do conhecimento, realizada por especialistas, é uma forma excepcional de construir mapas do conhecimento. Porém estas representações do conhecimento são construções artificiais, e em última análise determinadas ideológica e politicamente.

E ainda que, na teoria, a indexação tradicional através de seus processos de controle e ferramentas de organização da informação tenha seu resultado validado pela autoridade, na prática, por se tratar de atividade humana, a indexação não é consistente e nem mesmo universal. Estando sempre aberta à interpretação individual.

Em oposição à visão clássica de indexação, existe a ideia de que o significado de um documento deriva da interação entre este e o usuário, criando assim outras interpretações do documento além da autorizada. Seguindo este raciocínio, a fim de compreender a teoria e a prática da indexação, pode ser relevante considerar a indexação como uma prática comunicativa. Analisando a indexação sob esta luz, Talja et al. (2005) sugere um quadro metateórico social construcionista como uma forma de explorar as tendências recentes na prática de indexação de assunto, que vai além da atividade de indexação profissional, caminhando para uma abordagem com atribuição de termos de indexação pelo usuário, conhecida como indexação social.

Em relação aos objetos de informação textuais e não-textuais, Bahktin (1981) faz distinções entre aspectos monológicos e dialógicos na indexação, definindo indexação monológica como textos fechados e dirigidos a partir de uma fonte autorizada para uma audiência, como na prática da indexação tradicional. E dialógica, quando há abertura para interpretação, considerando as relações criadas entre o documento e seu usuário.

(15)

O aumento recente e contínuo no número de estudos da Ciência da Informação sobre as folksonomias e modelos de indexação social, sugerem que há um interesse crescente na prática da indexação dialógica, onde os usuários dos documentos são encorajados a adicionar suas próprias tags.

Uma alternativa a prática da indexação tradicional é a indexação baseada no autor. Esta abordagem assume que o autor vai usar termos que são comumente compreendidos e geralmente aceitos.

Porém Mathes (2004) argumenta que os motores de busca na Internet têm mostrado que a indexação pelo autor às vezes é errada, imprecisa, e algumas vezes fraudulenta. Mesmo que o autor seja verdadeiro e honesto, esta abordagem para a organização do conhecimento continua sendo monológica, como a orientada pelo especialista, pois a interpretação do autor de seu próprio trabalho pode ser considerada como autoritária. Quando um documento é criado e disseminado num espaço público, podemos dizer que o autor continua a ter controle total sobre seu significado? Esta resposta é não, se levarmos em consideração que o usuário é um elemento importante para a produção de sentido da obra, e a interpretação do usuário torna-se, provavelmente, ainda mais importante quando o esta é analisada em um contexto social ou histórico diverso do ambiente e momento da produção. O significado é historicamente contingente. Além disso, significados pessoais, particulares, dos usuários podem ser mais relevantes para estes do que os escolhidos pelo autor.

Chegamos então na indexação baseada em usuários. A transição dos documentos para espaços menos controlados e com maior engajamento dos usuários tem gerado interesse no estudo dos metadados compartilhados. O desafio permanece em como envolver os usuários na produção de metadados.

A indexação gerada pelo usuário começou a se desenvolver como uma abordagem alternativa. As folksonomias, termo cunhado por Thomas Vander Wal (2007), utilizam termos de indexação não hierarquizados e criados por grupos de usuários. São o conjunto de termos definidos por um grupo de usuários sem um conjunto predeterminado de termos de classificação ou rótulos (MATHES, 2004). Existem algumas vantagens na folksonomia ou indexação gerada pelo usuário, primeiramente, a indexação é mais barata e mais econômica em termos de tempo e esforço do que a prática de indexação tradicional, e em segundo lugar, porém não menos importante, há uma valorização do interesse no documento causada pela interação gerada entre este e a comunidade de usuários envolvida em sua indexação.

(16)

De uma forma geral o principal aspecto negativo apontado na literatura, no que tange a organização de informações em redes colaborativas com a classificação das informações pelos autores e usuários, é sem dúvida a ausência de um vocabulário controlado e o uso da linguagem natural, o que influencia diretamente na precisão da informação recuperada.

Porém o que por um lado pode representar uma fragilidade, talvez seja uma característica de grande riqueza, basta nos permitirmos um entendimento mais amplo deste fenômeno em que o centro das atenções está no processo colaborativo e na interação do usuário com objeto informacional, como nos mostra Valongueiro (2006), quando diz que a Folksonomia, ou indexação social, pode ser vista como um novo paradigma de classificação, pois respeita as diferenças culturais e características pessoais de quem utilizou e classificou determinada informação. Possibilitando aos próprios usuários da informação atribuir termos para a indexação dos conteúdos como eles os vêem.

São assim fatores essenciais na indexação livre e feita pelo usuário: a recuperação da informação indexada por este usuário e o ambiente aberto de desenvolvimento desse sistema de classificação, que possibilitam o compartilhamento e, em alguns casos, até a construção da informação, conforme destacam Catarino e Baptista (2007).

Talvez, portanto, a maior contribuição da indexação social seja a validação do mandado do usuário.

1.1 Indexação de imagens

Em geral, os sistemas de recuperação de imagem são baseados em sistemas de recuperação de texto, onde palavras são usadas para recuperar imagens, na perspectiva de um cientista da informação, é difícil imaginar como uma análise de pixels, formas, etc, pode conduzir a um sistema capaz de descrever a riqueza da denotação e sentido conotativo das imagens.

Existem muitos esforços na criação e aperfeiçoamento de sistemas de recuperação de imagens baseados em conteúdo, através da análise realizada por computador do conteúdo da imagem no nível do pixel, com extração automática de características como cor, textura e forma. Porém estes trabalham na sua absoluta maioria com conjuntos de imagens de um domínio restrito, comparando padrões presentes nas imagens, como é o caso de sistemas para reconhecimento facial, impressões digitais análise de exames médicos. Porém não há nestes casos, análise de conteúdo do ponto de vista

(17)

interpretativo, pois como as imagens digitais são compostas de pixels dispostos em uma infinita variedade de padrões, é impossível prever o padrão particular que iria corresponder a uma determinada imagem.

Em relação ao conceito ou recuperação de imagens baseado em texto, os pesquisadores reconhecem que estabelecer o significado das imagens é um problema complexo. Burke, em particular, têm se referido ao modelo de Panofsky dos “níveis de significado” como uma maneira de pensar sobre a operação de significado em imagens (BURKE, 1999). O principal problema reconhecido por praticamente todos os estudiosos da indexação de imagens baseada em texto é a da subjetividade do indexador ( MARKKULA; SORMUNEN, 2000). É altamente improvável que dois indexadores usem os mesmos termos para descrever uma imagem, e tem mesmo sido sugerido que o mesmo indexador pode muito bem indexar uma imagem de forma diversa em momentos diferentes (BJARNESTAM, 1998).

Neste quadro a indexação democrática se apresenta como uma abordagem alternativa para a recuperação baseada em conceito.

A indexação democrática difere da tradicional, por ter os usuários das imagens desempenhando papéis ativos na determinação de significado através da construção de sua próprias interpretações das imagens. E apesar de não cobrir todos os conteúdos de imagem, por exemplo, informações como: artista, data da criação e título. Ela cobre outros tipos de informações que permitem boas representações das imagens para recuperação e ainda tem a vantagem de refletir mudanças de significados das imagens. Maio aborda esta questão afirmando que a prática de indexação não é "um ponto morto e representação objetiva do assunto de um documento, mas a representação de um interpretação de um documento para uso futuro" (MAI, 2000).

2 Crowdsourcing e Computação Humana

A definição mais comum que encontramos na literatura para o termo crowdsourcing seria equivalente à computação humana, provavelmente por este termo estar intrinsicamente relacionado ao universo da tecnologia da informação.

(18)

O crowdsourcing em última análise é o processo de terceirização de tarefas tradicionalmente realizada por indivíduos em equipes especializadas para uma grupo indefinido de trabalhadores remotos através da Internet.

Esta abordagem permite às organizações, aumentarem a oferta de serviços, reduzirem preços e reagirem de forma mais flexível às suas demandas. Desta forma capitalizam sobre a produção distribuída em um grande universo de pessoas com grandes recursos, variadas habilidades e conhecimentos a custos relativamente baixos.

O uso de crowdsourcing tem sido amplamente promovido como solução para a execução de tarefas que os computadores não são capazes de executar, ou realizam de forma incompleta, como aquelas que fazem uso de conhecimentos ou habilidades que os seres humanos têm, mas que os computadores são incapazes de duplicar ou imitar.

Outro fator que influencia o crescimento do interesse em iniciativas de crowdsourcing é o aumento do número de pessoas com acesso à Internet e no tempo médio de dispendido pelos usuários em navegação na Web. Para termos uma ideia dos números envolvidos, segundo a Cisco, em 2012, havia 2,3 bilhões de usuários de Internet, cerca de 32% da população do mundo (7,2 bilhões) e a projeção é que em 2017 este número aumente para cerca de 3,6 bilhões de pessoas, ou seja, 48% da população projetada do mundo (7,6 bilhões).

As abordagens de computação humana são um exemplo proeminente de crowdsourcing e os GWAPs (Games whit a Purpose) ou, em tradução livre para o português, “jogos com um propósito” são um bom exemplo deste formato.

A ideia por trás dos GWAPs é simples: tarefas que são difíceis para computadores, mas fáceis para os seres humanos são “escondidas” em jogos de entretenimento. O público alvo destes jogos são utilizadores casuais da Internet. Ao jogar um GWAP os usuários, indiretamente, geram dados que podem ser utilizados para, por exemplo, construir o conhecimento necessário para treinar algoritmos. Desta forma é possível combinar inteligência humana e computacional para resolver um desafio. As primeiras propostas de GWAPs foram aplicadas em tarefas tão diversas como a indexação de imagem e vídeo, genética, processamento de linguagem natural e engenharia do conhecimento.

(19)

3 Análise do Google Image Labeler

3.1 Método de pesquisa

Propomos como metodologia para este trabalho uma pesquisa exploratória, que será conduzida a partir da análise de documentos publicados e dados disponíveis sobre o Google Image Labeler examinando sua interação com os usuários e potencial para indexação das imagens no contexto da Web.

3.2 Caracterização do Google Image Labeler

Os "jogos com um propósito" GWAP são um gênero de "computação humana", que terceirizam certos passos do processamento computacional utilizando pessoas. Representam um novo paradigma de aplicações que aproveitam o desejo das pessoas de se divertir terceirizando determinadas etapas do processo computacional para seres humanos. A função dos GWAP não é só atrair as pessoas a jogar de forma voluntária, mas também produzir metadados úteis como subproduto.

O Google Image Labeler é um jogo baseado em um conceito desenvolvido por Luis von Ahn e seu grupo de pesquisa da Universidade Carnegie Mellon.

Von Ahn criou um jogo intitulado “Percepção extra-sensorial” (ESP), que empregava jogadores combinados aleatoriamente e apresentadas a uma série de imagens. Os jogadores tinham um como tarefa emparelhar, num curto espaço de tempo, quantos rótulos fossem possíveis para cada imagem, recebendo pontos com base no número de termos que coincidam com os de seu parceiro.

O jogo ESP foi posteriormente adquirido pelo Google e transformado em Google Image Labeler, que em tradução livre para o português significa: rotulador de imagens Google.

A lógica por trás do jogo é motivar as pessoas a rotular às imagens porque é divertido.

Para ser eficaz, o jogo deve satisfazer dois requisitos. Deve obter a maior quantidade de rótulos, ou tags, possível para cada imagem e cada imagem só deve ser apresentada uma vez, a fim de maximizar o número de resultados por sessão de jogo.

(20)

Figura 1: Tela inicial do Google Image Labeler

Como podemos ver na imagem anterior, a página inicial do jogo tem uma estética bastante rudimentar em comparação com o design minimalista e modernista da maioria dos outros produtos do Google.

A imagem de um pássaro e o botão iniciar do jogo ficam em evidência. As listas de "Todays Top Pairs" (principais pares de hoje) e "All-time Top Contributors" (principais colaboradores de todos os tempos) também estão destacadas. Ainda consta na página uma explicação da mecânica do jogo incluindo: a forma como os jogadores são emparelhados, o tempo de duração de cada sessão e o forma de adquirir pontos (rotulação de imagens).

(21)

Figura 2: Tela do jogo Google Image Labeler.

Na imagem acima, vemos uma tela do jogo que mostra: a imagem a ser rotulada, um campo para digitação para enviar o rótulo (label), o botão para passar para outra imagem (desistência) o tempo restante da sessão (time left), o número de desistências (passes) e no canto direito da tela as palavras fora dos limites (off-limits) e os rótulos digitados pelo jogador (my labels).

Sobre as palavras off-limits, é necessário explicar que se tratam de termos já associados à imagem apresentada, portanto proibidos se serem utilizados. Esta foi a forma encontrada pelos criadores do jogo para aumentar a quantidade de rótulos de cada imagem e ao mesmo tempo gerar rótulos de melhor qualidade, pois como o objetivo dos jogadores em primeira instância é o de ganhar pontos no menor espaço de tempo e não de criar bons rótulos, o comum é a digitação de palavras óbvias e curtas.

Para aumentar a probabilidade de que um rótulo de imagem ser significativo era utilizado um artifício chamado: limite do rótulo. Isto significa que antes que quando uma etiqueta é associada à imagem ela recebe o status de palavra off-limits. O limite pode ser extremamente baixo com um par concordando ou alto como, por exemplo, quarenta pares concordado com o termo antes que este seja transformado em palavra off-limits e associado à imagem.

(22)

Uma imagem é considerada pronta quando passar pelo jogo várias vezes, acumulando uma grande lista de palavras off-limits, de modo que os pares são incapazes de chegar a acordo sobre novos rótulos e constantemente pedem para passar a imagem. A desistência repetida notifica ao sistema que uma imagem não deve mais ser usado para o jogo naquele momento.

Ainda assim uma imagem totalmente rotulada pode ser re-inserida no jogo, após um longo período de tempo, pois é possível que seus termos de indexação mudem ou sejam criados termos diversos em um novo contexto temporal.

Apesar do aplicativo ser jogado em duplas, não há obrigatoriedade de duas pessoas para jogar. Uma pessoa pode jogar tendo um conjunto de ações pré-gravado de algum jogo anterior como parceiro. Para cada imagem na sessão anterior, todos os palpites de cada participante são gravados, junto com informações sobre o tempo gasto para formular os palpites. Este conjunto de ações pré-gravadas é chamado de bot.

É importante salientar que o jogo pré-gravado não interrompe, necessariamente, o processo de rotulagem. Se o jogador e o bot concordam com um rótulo que foi selecionado quando as ações foram registradas, a confiança em relação a etiqueta aumenta.

Existe também a possibilidade de através de uma estratégia, haver trapaça no jogo com a intenção de obter pontuações mais altas. Jogadores poderiam criar uma estratégia unificada (difundida em sites ou fóruns na Internet) como, por exemplo, digitar a letra A em cada imagem.

Levando isso em consideração temos que analisar que:

1. O jogo pode ser jogado por milhares de pessoas ao mesmo tempo, a maioria está distribuída em locais diversos.

2. Como os jogadores são emparelhados de forma aleatória, eles não tem nenhuma informação sobre quem é o seu parceiro e, portanto, não tem como concordar previamente em uma estratégia específica.

3. A probabilidade de dois jogadores usando a mesma estratégia serem emparelhados é baixa.

Além disto, alguns mecanismos adicionais de segurança foram implementados para minimizar o engano. Primeiro, os endereços IP (Internert Protocol) ou protocolo Internet (endereço individual

(23)

atribuído a uma conexão à Internet) dos jogadores ficam registados e devem ser diferentes dos de seus parceiros.

Em segundo lugar, para combater um acordo abrangente de uma estratégia, usasse o jogo pré-gravado. Se for detectada uma estratégia de acordo, pode ser inserido no sistema um grande número de bots, tornando a estratégia menos eficiente.

E ainda o uso de uma estratégia global pode ser facilmente detectado através da medição da média de tempo em que os jogadores estão concordando nas imagens. Uma diminuição acentuada do tempo médio pode indicar a utilização de uma estratégia para burlar o jogo.

Apesar de todos os recursos de segurança é justo assumir que certa quantidade de trapaça é aceitável. Pois independente da possibilidade de termos inadequados e que não recuperem corretamente as imagens, todas as imagens recebem um conjunto de rótulos que já melhoraria o resultado das pesquisas em relação as técnicas utilizadas tradicionalmente pelos mecanismos de busca.

Uma observação importante sobre o Google Image Labeler é que ele só possuía versão na língua inglesa, portanto, para jogar o usuário precisava de um bom conhecimento da língua. E, além disso, o jogo só geraria rótulos em inglês, o que não beneficiaria, a princípio, a recuperação de imagens através de buscas no Google Images (motor de buscas de imagens do Google) utilizando palavras em outras línguas.

O Google Image Labeler foi lançado pelo Google em 31 de agosto de 2006, como versão beta. Em maio de 2007, mudanças substanciais foram introduzidas. Em vez de 90 segundos jogadores tinha 2 minutos. Em vez da recompensa fixa de 100 pontos por imagem, a pontuação passou a recompensar a maior especificidade. A pontuação de cada palavra passou também a ser exibida ao invés de simplesmente a pontuação total da partida, como anteriormente, o que tornou mais fácil avaliar o valor exato de cada termo em relação a todos os termos digitados. Estas mudanças demonstram a necessidade de ajustes sofridos pelo jogo para enriquecer a qualidade da indexação das imagens e um melhor entendimento dos hábitos dos jogadores.

Em setembro de 2011 o jogo foi cancelado pelo Google, junto a uma série de outros aplicativos. As razões para o descontinuamento do Google Image Labeler não foram anunciadas.

Uma forma eficiente de simular a experiência de jogar o Google Image Labeler é através da iniciativa ARTigo, disponível em http://www.artigo.org onde uma versão bastante similar ao jogo

(24)

(inclusive nas funcionalidades e regras) está disponível com o objetivo de rotular acervos de imagens de obras de arte.

3.3 Análise dos resultados do Google Image Labeler como ferramenta de indexação

A bibliografia disponível sobre o Google Image Labeler não é extensa, na realidade existe um número maior de documentos que tratam do ESP game (iniciativa que lhe deu origem). Fato que, na verdade, não causa estranhamento, pois, sendo o ESP o projeto original e tendo sido criado na comunidade acadêmica, é natural que os olhos dos estudiosos se voltem mais sobre ele.

É interessante ainda acrescentar que apesar da limitada quantidade de documentos que conseguimos coletar, estes são de outra forma ricos para nossa análise, por terem origem em áreas do conhecimento diversas da Ciência da Informação. O que vem de encontro com o nosso desejo de criar uma imagem mais multidisciplinar da questão em tela.

O que nos interessou na escolha do Google Image Labeler como objeto de pesquisa, foi muito mais o fato deste ter sido utilizado (graças ao poder do Google) por um número muito maior e mais diverso de usuários do que os participantes do projeto ESP.

Do ponto de vista qualitativo, na impossibilidade de executar uma análise na qualidade dos rótulos criados pelo Google Image Labeler, pois não há fontes que tratem do assunto, podemos examinar os resultados na recuperação auxiliada pelo ESP, obtidos pro von Ahn e equipe ainda no ambiente acadêmico. É importante salientar que foram estes resultados quando apresentados, que criaram o interesse do Google na aquisição do modelo do ESP para a criação do seu Google Image Labeler.

Em uma avaliação foram examinados os resultados de pesquisa para todas as imagens associadas à determinados marcadores. Para isso, foram selecionadas 10 etiquetas de forma aleatória a partir do conjunto de todos os rótulos coletados por meio do jogo. Foram escohidos rótulos que ocorreram em mais de 8 imagens. Neste teste 100% das imagens recuperadas faziam sentido no que diz respeito às etiquetas de teste.

Em outro teste, 15 pessoas que nunca haviam experimentado o jogo deveriam descrever imagens criando rótulos e estes posteriormente foram comparados com rótulos gerados para estas

(25)

mesmas imagens a partir do jogo. Vinte imagens foram escolhidas aleatoriamente de um conjunto de 1023 imagens que tinham mais do que cinco etiquetas associadas.

Para cada imagem, o participante foi convidado a digitar seis palavras que melhor descrevessem o conteúdo da imagem apresentada. Os resultados indicaram que em todas as 20 imagens, pelo menos, 5 (83 %) das 6 etiquetas digitadas pelos participantes do teste foram igualadas pelo jogo. (VON AHN; DABBISH, 2004).

Além disso, para 100% das imagens, as três palavras mais comuns inseridas pelos participantes, haviam sido coletadas também pelo jogo.

Portanto, os testes demonstram que os rótulos das imagens obtidos através do jogo, são tipicamente de boa qualidade. Além disso, foi constatado que os resultados dos jogos permitiam recuperação mais precisa de imagens, ajudavam os usuários a bloquear imagens inadequadas (pornografia, por exemplo) e melhoravam a acessibilidade da Web (os rótulos podem ajudar pessoas com deficiência visual na navegação).

Na perspectiva quantitativa do potencial de engajamento de pessoas e do número de rótulos criados pelo jogo utilizamos novamente estudos estatísticos realizados pelos criadores do jogo ESP.

Com base em um relatório de 2004, um total de 13.630 pessoas jogou o jogo ESP, gerando 1.271.451 rótulos para 293.760 imagens diferentes em um período de quatro meses. Aproximadamente 80% das pessoas jogaram em mais de uma ocasião e 33 pessoas jogaram mais de 1.000 jogos.

"Acreditamos que estes números fornecem evidências de que a jogo é divertido: quase 1,3 milhão de etiquetas foram coletadas com apenas 13.630 jogadores, alguns dos quais passaram mais de 50 horas jogando o jogo!" (VON AHN; DABBISH, 2004).

Num documento posterior sobre o ESP e seus números, von Ahn e Dabish (2008) mostram que desde seu lançamento até julho de 2008, mais de 200.000 jogadores tinham contribuído com aproximadamente 50 milhões de rótulos. Se fizermos uma simulação calculando que cada jogador gaste em média 91 minutos com o jogo, temos um rendimento de cerca de 233 rótulos de cada jogador por hora, ou seja, um rótulo novo a cada 15s.

(26)

3.4 Análise dos usuários com o Google Image Labeler

Segundo observação de von Ahn (2006), pessoas ao redor do mundo gastam bilhões de horas com jogos de computador. O que o fez pensar em como aproveitar este tempo e energia para fazer as pessoas trabalharem de graça. Porém ao contrário dos processadores de computador, seres humanos necessitam de algum incentivo para se tornarem parte de um esforço. Portanto ele imaginou que o uso de jogos online poderia ser um método de sedução interessante para incentivar pessoas a participarem de um processo.

No projeto do jogo os jogadores são atendidos apenas na medida do que é necessário para se interessarem em jogar. Por esta razão, no Google Imagem Labeler apesar do real propósito de rotulagem imagens ser apresentado, o foco está na criação de um ambiente de diversão que maximize o tempo que as pessoas gastam com o jogo. Von Ahn afirma não esperar que voluntários simplesmente rotulassem todas as imagens da Web. Esperava que as imagens fossem rotuladas porque as pessoas iriam querer jogar o jogo (VON AHN; DABBISH, 2004).

Assim a diversão é usada como incentivo para garantir a eficiência da máquina. Por exemplo, recursos como as listas dos jogadores com mais pontos, ajudam a criar um ambiente competitivo e, assim, incentivar que se jogue mais vezes. O ritmo acelerado do jogo além de torná-lo mais emocionante, também assegura que o tempo com o jogo é gasto de forma a maximizar o número de rótulos criados.

Em suma, a idéia no núcleo do Google Image Labeler é que as pessoas são motivadas por interesse próprio. Assim, entendemos que a chave para o engajamento das pessoas em uma atividade é criar um ambiente que é atraente, independentemente de seu propósito final.

A fim de analisar se o jogo atende aos objetivos descritos acima e compreender as experiências das pessoas ao jogá-lo, utilizamos uma abordagem qualitativa, buscando comentários de usuários na Internet. Apesar de a amostra ser restrita acreditamos que neste caso a inclusão de declarações e comentários de usuários permite uma análise dialógica que se sobrepõem à precisão representacional.

Após analisar vários sites, blogs e fóruns de discução sobre o jogo foi escolhido o fórum: Google SEO News and Discussion Forum do site webmasterworld.com, por ter um número interessante de participantes e uma discussão de alto nível.

(27)

Vale salientar que este grupo de discussão é provavelmente formado por pessoas versadas em tecnologia e com interesse prático na indexação de imagens (suposição amparada no perfil do site webmasterworld.com, que serve como espaço para troca de ideias entre webmasters)

Para fins de análise, dividimos os comentários em seis temas: positivos em relação ao conceito do jogo (uso de crowdsourcing na indexação de imagens), negativos em relação ao conceito do jogo, positivos em relação à jogabilidade (diversão), negativos em relação à jogabilidade, positivos quanto aos possíveis resultados da indexação e negativos quanto aos possíveis resultados da indexação.

De um total de 51 mensagens de 40 participantes do fórum 9 não tinham relação diretamente com o jogo ou não se enquadravam nos temas selecionados, nas restantes obtivemos comentários distribuídos segundo os temas da forma apresentada nos gráficos abaixo.

Gráfico 1: Comentários relacionados ao conceito do jogo.

Como podemos ver no gráfico acima, no ponto de vista dos participantes do fórum sobre o Google Image Labeler, o conceito do jogo é percebido por mais da metade dos jogadores de forma mais positiva do que negativa.

(28)

Gráfico 2: Comentários relacionados à jogabilidade.

Independente de posições positivas ou negativas em relação ao conceito e resultados gerados pelo jogo os números sobre a jogabilidade ou sua capacidade de atração são de 63% que gostaram contra apenas 37% que não tiveram interesse.

(29)

Gráfico 3: Comentários relacionados aos resultados de indexação.

Porém no quesito qualidade da indexação a maioria dos usuários, gostando ou não do jogo, suspeitam do resultado da indexação de imagens que poderá ser fornecida pelo jogo como nos mostra o gráfico.

A seguir expomos alguns comentários escolhidos por seu conteúdo, para exemplificar as posições sobre o jogo, todos com o texto abaixo traduzido livremente do inglês.

Nos dois comentários a seguir vemos apreciação e entendimento claro do objetivo do jogo: a indexação de imagens para o Google.

(30)

JeremyL

msg:3069285

8:37 pm on Sep 1, 2006 (gmt 0)

Very interesting. Google didn't just create this for fun, so what are they trying to learn? If they have enough people play the game, I am guessing the data can be used to help determine the quality of the image search algo.

Figura 3: Mensagem de JeremyL, retirada do Google Seo News and Discussion Forum.

“Muito interessante. O Google não criou isso apenas por diversão, então o que eles estão tentando aprender? Se eles têm um número suficiente de pessoas jogando o jogo, eu suponho que os dados podem ser usados para ajudar a determinar a qualidade do algoritmo de busca de imagens.”

TravelSite

msg:3071278

2:48 pm on Sep 4, 2006 (gmt 0)

Great - I really enjoyed that :) I'm easily amused!

There should be more images to do though in a single game. ...and most of the images are too small for me to see clearly on my 12inch/1400x1050 tablet.

I assume that this is to get humans to correctly label things for the Google Images search - a brillant idea :)

Figura 4: Mensagem de TravelSite, retirada do Google Seo News and Discussion Forum.

“Grande - Eu realmente gostei. Divirto-me facilmente!

Deveria haver mais imagens para fazer em um único jogo.

e ... a maioria das imagens são muito pequenas para ver claramente no meu monitor de 12 polegadas.

Presumo que isto é pegar os seres humanos para rotular corretamente as coisas para o buscador de imagens do Google - uma ideia brilhante.”

(31)

Nas falas destes usuários fica claro que o interesse em auxiliar o Google a ter um melhor resultado na busca por imagens é vista como positiva

Os comentários negativos sobre o princípio do jogo são todos claramente contra o fato do Google, uma empresa, estar utilizando mão-de-obra gratuita como vemos no exemplo a seguir:

mattg3

msg:3070274

2:26 am on Sep 3, 2006 (gmt 0)

google would actually be paying me

Nah capitalism works by getting the lowest available price and sadly somewhere on this planet there will always be someone doing it for free.

Figura 5: Mensagem de mattg3, retirada do Google Seo News and Discussion Forum.

“google podeira realmente estar me pagando”

“Não o capitalismo funciona conseguindo o menor preço disponível e, infelizmente, em algum lugar deste planeta, sempre haverá alguém o fazendo gratuitamente.”

Sobre a habilidade de divertir e de fazer com que os jogadores despendam uma boa quantidade de tempo no jogo e voltem a jogar outras vezes, podemos avaliar que para determinado público o projeto do jogo é bastante eficaz conforme podemos ver nos cometários abaixo.

Kufu

msg:3071589

7:58 pm on Sep 4, 2006 (gmt 0)

This is ultra-addictive.

A brilliant way to help test the accuracy of their image search if you ask me.

Figura 6: Mensagem de Kufu, retirada do Google Seo News and Discussion Forum.

(32)

Se você me perguntar é uma excelente maneira de ajudar a testar a precisão de sua busca de imagens.”

SEOtop10

msg:3069575

3:31 am on Sep 2, 2006 (gmt 0)

I just played it and it quickly becomes addictive. Great way to exercise the brain - the kind of lateral thinking that humans can do can't be matched.

No, you can't label a man a man because you have to match against an unknown partner, who might not be trying to game the system. And what do you gain even if you could?

Figura 7: Mensagem de SEOtop10, retirada do Google Seo News and Discussion Forum.

“Eu acabei de jogar e ele rapidamente se torna viciante. Ótima maneira de exercitar o cérebro - o tipo de pensamento lateral que os seres humanos podem fazer não pode ser igualado.

Não, você não pode rotular de homem um homem, porque você que jogar contra um parceiro desconhecido, que pode não estar tentando burlar o sistema. E o que você ganha, mesmo se pudesse?”

MamaDawg

msg:3071495

6:15 pm on Sep 4, 2006 (gmt 0)

Very addictive, whatever the ulterior motive is ...

Figura 8: Mensagem de MamaDawg, retirada do Google Seo News and Discussion Forum.

“Muito viciante, independente de qual seja o motivo oculto...”

E finalmente sobre a qualidade da indexação os críticos discutem que os resultados que provavelmente serão gerados pelo Google Image Labeler não são de grande utilidade, pois o próprio design do jogo leva os jogadores a utilizarem termos genéricos para descrição, pois assim é possível adquirir mais pontos por partida e melhorar a posição no ranking.

(33)

Leosghost

msg:3069470

11:53 pm on Sep 1, 2006 (gmt 0)

lowest common denominator = quality search?

Figura 9: Mensagem de Leosghost, retirada do Google Seo News and Discussion Forum.

“o menor denominador comum = qualidade na busca?”

thetrasher

msg:3069361

10:07 pm on Sep 1, 2006 (gmt 0)

If you label each photo of a man with "man", each photo of a woman "woman" and each photo of a bridge "bridge" it's not that useful.

Figura 10: Mensagem de thetrasher, retirada do Google Seo News and Discussion Forum.

“Se você marcar cada foto de um homem com "homem", cada foto de uma mulher "mulher", e cada foto de uma ponte "ponte" não é tão útil.”

Porém fica claro que os usuários que defendem a iniciativa percebem que o objetivo do Google Image Labeler é o de gerar uma indexação sem grande profundidade, que tem como principal função melhorar a recuperação e precisão nas pesquisas por imagens, utilizando texto, no buscador de imagens do Google, como vemos a seguir.

(34)

whoisgregg

msg:3070057

6:32 pm on Sep 2, 2006 (gmt 0)

If you label each photo of a man with "man", each photo of a woman "woman" and each photo of a bridge "bridge" it's not that useful.

It's very useful if someone later wants to search for images of a "man," a "woman," or a "bridge." The current method of keywording images is by inferring the image's content based on surrounding text.

The "off-limits" words are ones that have been chosen over and over again. So, the most common words will stop counting for points as time goes by, forcing the players to choose more specific keywords.

I actually hope Google offers this as a business service to companies with image collections that need to be keyworded.

Figura 11 – Mensagem de whoisgregg, retirada do Google Seo News and Discussion Forum.

“Se você marcar cada foto de um homem com "homem", cada foto de uma mulher "mulher", e cada foto de uma ponte "ponte" não é tão útil.”

“É muito útil se alguém mais tarde quer procurar imagens de um "homem", "mulher", ou uma "ponte". O método atual de atribuir palavras-chave para imagens é inferirindo o conteúdo da imagem com base no texto circundante.

As palavras "fora dos limites" são aquelas que foram escolhidas várias vezes. Então, as palavras mais comuns irão parar de contar para os pontos com o passar do tempo, forçando os jogadores a escolher palavras-chave mais específicas.

Na verdade, eu espero que o Google ofereça isto como um serviço para as empresas com coleções de imagens que precisam receber palavras-chave.”

Dos números apresentados nos gráfico e da leitura dos comentários podemos deduzir que:

 A principal razão para descontentamento é o fato de o Google utilizar pessoas para executar uma tarefa que gera resultados comerciais para a empresa sem contrapartida financeira. Estes usuários se

(35)

sentem “usados”, porém possivelmente o número dos que não tem esta visão crítica já será suficiente para que a ferramenta atinja seu propósito.

 A jogabilidade ou fator “diversão” foi considerada mais positiva do que negativa e os comentários que tratam da jogabilidade de forma positiva foram mais enfáticos.

 Apesar das estatísticas de tempo de uso e quantidade de usuários não estarem disponíveis para o Google Image Labeler. As pessoas consideram, de forma geral, o jogo como divertido ou viciante. O que vem de encontro ao projeto original do jogo que espera que os usuários se envolvam não pelo interesse na atividade de indexação em si, mas sim pelo prazer ou desafio de jogar.

 Mesmo na opinião dos mais críticos fica claro que o jogo é capaz de entregar resultados de indexação básicos para uma quantidade grande de imagens o que segundo nosso entendimento atende a pretenção do projeto, de ser uma opção complementar nas iniciativas de melhorar a recuperação de imagens através de busca de texto no Google Images.

4 Discussão e contribuições

Através do que foi analisado neste trabalho vemos de forma otimista a utilização de GWAPs (jogos com um propósito) na indexação de imagens, seja pelos seus resultados: na quantidade de imagens possíveis de rotular com estas ferramentas, na qualidade dos metadados criados (principalmente descritivos) ou na interação dos usuários com questões de indexação.

Um dos pontos que nos chamou a atenção, principalmente, nos textos de sites, blogs e nas discussões em fóruns sobre o Google Image Labeler, é que independente das opiniões positivas ou negativas sobre a iniciativa do Google, um universo bastante representativo de pessoas passou a perceber e discutir as questões que envolvem a indexação. Acreditamos que muitos usuários da Internet que possivelmente não tinham conhecimento do funcionamento dos motores de busca ou do propósito exato dos metadados, acabaram tendo um contato com a experiência de indexação simplesmente pelo desejo de participar do jogo.

Outra questão que precisamos ressaltar é a de que apesar dos resultados que avaliamos como positivos, o Google Image Labeler acaba sendo, principalmente, um exemplo de como a Web pode ser usada para agregar contribuições de indivíduos na execução de tarefas difíceis, considerando os indivíduos como unidades de processamento que se tornam parte da mecânica do jogo. Assim há pouca

(36)

atenção na experiência do jogo ou na comunidade de indivíduos formada em torno dele o que poderia, potencialmente, criar uma oportunidade para gerar um maior capital social.

Na realidade apenas pelo fato de se utilizar de humanos é que podemos definir o jogo como uma experiência social, pois conectar indivíduos ao jogo é muito diferente de conectá-los entre si. Distante de criar uma comunidade de interesse em torno da questão, como é comum no uso social da rede, a participação dos usuários é reduzida, simplesmente, a ser parte do jogo e assim em vários aspectos são desprezadas as potencialidades individuais e coletivas de participação em uma atividade de colaboração, como por exemplo: compromisso, responsabilidade e aprendizado.

Apesar disso, consideramos que iniciativas como o ARTigo (citado previamente) demonstram que há espaço para o uso de ferramentas similares ao Google Image Labeler como ferramenta complementar na indexação de coleções de imagens, o que provavelmente, em casos que contemplem imagens pertencentes a um universo restrito e com o engajamento de usuários que tenham um certo domínio sobre seu conteúdo, poderiam ser soluções economicamente viáveis na indexação de imagens de repositórios controlados, criando uma indexação ao mesmo tempo viva, por ser constantemente atualizada e extremamente dialógica e democrática.

5 Considerações Finais

No Google Image Labeler podemos perceber um insight na criação do jogo de como a Ciência da Computação utiliza, neste caso, a habilidade, energia e tempo de usuários da Internet como recursos para solução de problemas de indexação de imagens, transformando-os em peças do sistema e aproveitando quase que exclusivamente sua capacidade de processamento, numa abordagem bastante diversa da que é comum na Ciência da Informação. O que, porém, de forma alguma invalida a iniciativa, dado que são gerados resultados que atendem ao seu propósito.

Pelo que podemos apreender dos documentos que tratam do Google Image Labeler nos parece que apesar da sua discontinuidade pelo Google, que entendemos como uma possível descrença nos seus resultados ou obsolecência da sua efetividade, ele é uma ferramenta poderosa para gerar indexação e tem potencial para utilização na indexação de coleções de imagens, minimizando despesas e viabilizando uma maior interação entre os usuários e os documentos.

(37)

Percebemos, portanto, que iniciativas utilizando o crowdsourcing, podem trazer grandes benefícios na indexação de acervos como, por exemplo:

Reduzir recursos financeiros, de pessoal e o tempo na execução de trabalhos de indexação. Engajar usuários construindo novas comunidades de interesse em determinadas coleções de documentos e áreas de informação.

Utilizar o conhecimento, experiência e interesse da comunidade, aumentando assim o valor dos dados associados aos documentos através de: rótulos, comentários e avaliações.

Estas são em resumo as ideias defendidas por Kuhlthau (2005) quando fala da aprendizagem informacional centrada no usuário, para busca e recuperação da informação. A autora acredita que as dinâmicas de colaboração se ampliarão devido a natureza interdisciplinar da área da Ciência da Informação e as facilidades geradas no ambiente Web. Este novo paradigma, da aprendizagem informacional, já dispõe dos recursos e ferramentas digitais, que facilitam a comunicação e o processo de compartilhamento e recuperação da informação de forma colaborativa.

(38)

Referências

AMARAL, Adriana; AQUINO, Maria Clara. Práticas de Folksonomia e Social Tagging no Last.fm. In: Simpósio Brasileiro de Fatores Humanos em Sistemas Computacionais, 8. 2008. Anais... Porto Alegre, 2008.

ARTIGO. ARTigo. Disponível em: <http://www.artigo.org/taggingGame.html>. Acesso em: 15 dez. 2013.

BAKHTIN, Mikhail Mikhailovich. The Dialogic Imagination: Four Essays by M. M. bakhtin. Austin: University Of Texas Press, 1981. 434 p. (University of Texas Press Slavic series, no. 1). Tradução de Voprosy literatury i estetiki. Disponível em: <http://www.public.iastate.edu/~carlos/607/readings/ bakhtin.pdf >. Acesso em: 10 jan. 2013.

BERMAN, Sandford. Prejudices and antipathies: a tract on the LC subject heads concerning people. Jefferson: Mcfarland & Company, Inc., 1993. Introdução: Eric Moon. Disponível em: <http://www.sanfordberman.org/prejant.htm>. Acesso em: 15 dez. 2013.

BJARNESTAM, Anna. Text-based hierarchical image classification and retrieval of stock

photography. Disponível em: <http://bcs.org/upload/pdf/ewic_im98_paper4>. Acesso em: 15 dez.

2013.

BRASCHER, Marisa; CAFÉ, Lígia. Organização da Informação ou Organização do

Conhecimento. Disponível em:<http://www.ibict.br/publicacoes/eroic.pdf>. Acesso em: 24 abr. 2012.

BURKE, A. Maria, Organizing Multimedia Information: Principles and Practice of Information Retrieval. Brookfield: Ashgate Publishing Company, 1999. P. 236. Disponível em: < http://dl.acm.org/citation.cfm?id=520546> Acesso em: 15 dez. 2013.

CATARINO, M. E.; BAPTISTA, A. A. Folksonomia: um novo conceito para a organização dos recursos digitais na Web. In: Revista Data Grama Zero, v.8, n.3, jun. 2007. Disponível em: <http://www.dgz.org.br/jun07/F_I_art.htm>. Acesso em: 25 mai. 2012.

CISCO. Cisco's Visual Networking Index Forecast Projects Nearly Half the World's Population

Will Be Connected to the Internet by 2017: Global IP Traffic Predicted to Grow Three-fold from

2012 to 2017. Disponível em: <http://newsroom.cisco.com/press-release-content?type=webcontent &articleId=1197391>. Acesso em: 03 fev. 2014.

GOOGLE IMAGE LABELER. Disponível em:<http://images.google.com/imagelabeler/>. Acesso em: 30 mar. 2011.

(39)

JAFARINAIMI, Nassim. Exploring the character of participation in social media: the case of

Google Image Labeler. iConference 2012: 72-79. Disponível em: <http://www.contrib.andrew.cmu.

edu/~njafarin/iconference_imageLabeler.pdf> Acesso em: 15 dez. 2013.

KUHLTHAU, Carol C. Towards collaboration between information seeking and information retrieval.

Information Research. v. 10, n. 2, jan. 2005. Disponível em:

<http://informationr.net/ir/10-2/paper225.html> Acesso em: 15 dez. 2013.

MAI, Jens-erik. The Subject Indexing Process: an investigation of problems in knowledge representation. 2000. 345 f. Tese (Doutorado) - Curso de Filosofia, The University Of Texas At Austin, Austin, 2000. Disponível em: <http://jenserikmai.info/Papers/2000_PhDdiss.pdf>. Acesso em: 15 dez. 2013.

MARKKULA, Marjo; SORMUNEN, Eero. End-user searching challenges indexing practices in the

digital newspaper photo archive. Disponível em: <http://citeseerx.ist.psu.edu/viewdoc/download?

doi=10.1.1.20.3063&rep=rep1&type=pdf>. Acesso em: 10 jan. 2013.

MATHES, Adam. Folksonomies – cooperative classification and communication through shared

metadata. Disponível em: <http://www.adammathes.com/academic/computer-mediated-communication/folksonomies.html>. Acesso em: 10 jan. 2013.

MOURA, Maria Aparecida. Informação, ferramentas ontológicas e redes sociais ad hoc: a interoperabilidade na construção de tesauros e ontologias. Informação & Sociedade: Estudos, v.19, n.1, p. 59-73, jan./abr. 2009. Disponível em:<http://www.ies.ufpb.br/ojs2/index.php/ies/article/view/ 2396/2688>.24 abr. 2012.

ORTEGA,Cristina Dotta. Relações históricas entre Biblioteconomia, Documentação e Ciência da Informação. DataGramaZero - Revista de Ciência da Informação - v.5, n.5, out. 2004. Disponível em: <http://www.dgz.org.br/out04/Art_03.htm>. Acesso em: 24 abr. 2012.

POMBO, Olga. Da classificação dos seres à classificação dos saberes. 2002. Disponível em: <http://www.educ.fc.ul.pt/hyper/resources/opombo-classificacao.pdf>.Acesso em: 25 mai. 2012. SINGH, Vivek K.; JAIN, Ramesh; KANKANHALLI, Mohan S. Motivating contributors in social

media networks. 2009. Disponível em: <http://web.media.mit.edu/~singhv/publications/soc_med_ acmmm2009.pdf> Acesso em: 15 dez. 2013.

TALJA, Sanna; TOUMINEN, Kimmo; SAVOLAINEN, Reijo. "“Isms” in information science: constructivism, collectivism and constructionism", Journal of Documentation - v. 61 n. 1, p.79-101, 2005. Disponível em: <http://www.emeraldinsight.com/journals.htm?articleid=1465009&show= abstract> Acesso em: 15 dez. 2013.

VALONGUEIRO, André. Sobre folksonomia, tags e afins. Blog do autor. Disponível em: <http://valongueiro.blogspot.com/2006-10-01-archive.html>. Acesso em: 25 mai. 2012.

(40)

VANDER WAL, Thomas. Folksonomy coinage and definition in off the top. 2007. Disponível em: <http://vanderwal.net/folksonomy.html> Acesso em: 25 mai. 2012.

VON AHN, Luis. Games with a Purpose. Computer. Los Alamitos, p. 92-94. jun. 2006. Disponível em: <http://www.cs.cmu.edu/~biglou/ieee-gwap.pdf>. Acesso em: 15 dez. 2013.

VON AHN, Luis; DABBISH, Laura. Designing games with a purpose. Communications Of The

Acm, Nova Iorque, v. 51, n. 8, p.58-67, ago. 2008. Disponível em: <http://doi.acm.org/10.1145/1378704.1378719>. Acesso em: 15 dez. 2013.

VON AHN, Luis; DABBISH, Laura. Labeling images with a computer game. In: CHI 2004, 1., 2004, Viena. Proceedings... . Nova Iorque: Acm, 2004. p. 319 - 326. Disponível em: <https://www.cs. cmu.edu/~biglou/ESP.pdf>. Acesso em: 15 dez. 2013.

WEBMASTERWORLD. Google Seo News and Discussion Forum. Disponível em: <http://www.webmasterworld. com/google/3069176.htm>. Acesso em: 13 jan. 2014.