• Nenhum resultado encontrado

A ferramenta de busca Google

A ferramenta de busca Google, como citado anteriormente, surgiu em setembro de 1998. Segundo Ocaña-Sanchez (2013), nesta data o primeiro índice do Google já tinha a enorme quantidade de 26 milhões de sites indexados em sua versão beta. Rapidamente começou a ganhar popularidade e em fevereiro de 1999 já processava cerca de 500.000 buscas por dia. Alves (2004) afirma que em setembro de 1999 a versão beta se tornou oficial e cresceu até se tomar o principal mecanismo de busca da Web. Ocaña-Sanchez (2013) estima que naquela data o buscador recebia uma média de 7 milhões de visitas diárias, passando para 15 milhões em 2000 e 100 milhões em 2001. Alves (2004) declara que em 2003 o índice do Google havia atingido 3.3 bilhões de documentos, consolidando-se como o maior entre todos os motores de busca.

Ressalta-se aqui a celeridade de seu crescimento. Segundo informações coletadas no site da própria empresa (SOBRE O GOOGLE, 2014) atualmente o buscador oferece acesso a mais de 30 trilhões de páginas, respondendo as consultas em menos de meio segundo. Estima- se que o site processe, em média, dois bilhões de consultas por dia. Ainda com informações do Google, a pesquisa na Internet ocorre de forma livre e isenta de qualquer tipo de intervenção humana, garantindo que os resultados de busca e o processo de seleção dos itens mais procurados estejam completamente isentos de manipulações. Entretanto, como se evidencia mais adiante (item 3.3), alguns autores discordam fortemente desta alegação.

Dentre as características da pesquisa Google estão a simplicidade de sua página, a classificação por relevância baseada na análise dos links, cache de páginas e alta capacidade de indexação, coletando o texto completo da web e também o código HTML. O grande diferencial da pesquisa Google reside entre o processo de pesquisa e a página de resultados; mais exatamente na atualização das tecnologias capazes de oferecer precisão nos resultados. Informações coletadas de empresas de Tecnologia da informação e Search Engine

Optimization – SEO25–– indicam que a cada ano, o Google muda seu algoritmo de busca em

torno de 500 vezes. Enquanto a maioria dessas mudanças é pequena, ocasionalmente há uma

25

MOZ. Google Algorithm Change History. Disponível em: http://moz.com/google-algorithm-change. Acesso em: 08 ago. 2015. A Visual History of Google Algorithm Changes. Disponível em

63

grande atualização algorítmica (como o Google Panda e Google Penguin, mostrados a seguir) que afeta significativamente os resultados da pesquisa.

Uma das primeiras e principais peculiaridades do mecanismo de busca Google e sem dúvida, o que o tornou distinto dos demais, foi o desenvolvimento do algoritmo PageRank. Trata-se de um sistema do Google para classificar a ordem de exibição das páginas por relevância. Uma página com um PageRank mais elevado é considerada mais importante e é mais provável que seja exibida nos primeiros resultados. Como ensina Silva (2009, p. 13)

“PageRank por definição é um número que mede a reputação de cada página Web”. São

centenas de fatores considerados no cálculo de um PageRank26, como popularidade da página e a posição, proximidade e o tamanho dos termos de pesquisa dentro da página.

Explorando as informações institucionais do site da companhia, a seção “Por dentro da

Pesquisa”27

revela que o buscador também emprega outros algoritmos, que conjugam “mais de 200 sinais ou pistas diferentes” para prenunciar o que o utilizador procura. Há ainda a aplicação de técnicas, como o sistema de correção ortográfica e o recurso autocompletar, para descobrir a intenção provável do usuário e oferecer alternativas.

Com relação aos sistemas de index; no final de 2010 a empresa anunciou a conclusão de um novo sistema de indexação web chamado Caffeine. Segundo os desenvolvedores, quando comparado ao anterior, o novo índice mostrou-se capaz de fornecer resultados 50% mais atualizados para pesquisas na web, representando a maior coleção de conteúdo web então oferecida pela companhia.

Em fevereiro de 2011, o Google lançou uma nova versão de um de seus algoritmos utilizados nas buscas: o Google Panda. A empresa sinalizou que o Panda atuaria como um filtro, conferindo mais valor para o conteúdo; rebaixando sites de baixa qualidade, pouco substanciais ou em cujo conteúdo houvesse grandes quantidades de publicidade. Segundo Slegg (2014) o Panda já está em sua versão 4.0 e entrou em vigor em maio de 2014.

Em 2012 a empresa lançou uma nova atualização, desta vez com o nome de Penguin. De acordo com o blog oficial do Google, o Penguin é uma mudança importante do algoritmo,

26

Explicações mais precisas sobre o cálculo PageRank podem ser obtidas em: Google PageRank: Matemática básica e métodos numéricos. Centro de Matemática Universidade do Porto

http://cmup.fc.up.pt/cmup/mecs/googlePR.pdf. Acesso em: 08 ago. 2015.

27

GOOGLE. Por dentro da pesquisa. Disponível em: http://www.google.com/intl/pt-br/insidesearch/. Acesso: 08 ago. 2015.

64

desta vez orientado à Webspam28. A mudança objetivava diminuir rankings de sites que a empresa acredita estarem violando as diretrizes de qualidade existentes do Google.

Na semana de seu 15º aniversário (2013) a empresa Google apresentou seu novo

algoritmo de buscas denominado ‘Hummingbird’ (beija-flor em inglês). A referência se deve

à agilidade e exatidão conferidas pela modernização da ferramenta. As últimas atualizações nomeadas Penguin e Panda consistiram em ajustes em cima do mesmo algoritmo matemático. Contudo, desta vez, o Google lançou um mecanismo integralmente novo.

O vice-presidente sênior e engenheiro de software da Google, Amitabh Singhal, declarou à imprensa em uma notícia da Technology Review29, veiculada pela agência Reuters, que “as pessoas passaram a fazer perguntas muito mais complexas ao Google, por isso o algoritmo teve que ser repensado quanto a seus aspectos mais fundamentais30". O novo recurso tenta se adaptar aos novos tempos da Internet, que tem cada vez mais usuários e pesquisas mais complexas e elaboradas.

Segundo Silva (2003) os avanços mais recentes na área de tecnologia dos motores de pesquisa consistem em situá-los em uma nova fase: a Extração de Informação (EI). A Recuperação de Informação (RI) mostra-se um desafio vencido. De acordo com este autor “a RI aplicada na Internet tem como objetivo recuperar páginas e indexá-las baseando-se em dados estatísticos sobre a ocorrência de palavras-chave”. Entretanto a RI apresenta diversos problemas como Riloff e Lehnert (1994, citados por Silva, 2003 p. 21) apontam: a sinonímia, a polissemia e questões de contextos locais e globais. São os casos de palavras diferentes com o mesmo significado ou mais de um significado para uma única palavra (como sede – variando de acordo com os tópicos fisiologia/corporação). A relevância de uma palavra pode variar também de acordo com o contexto em que é empregada.

As dificuldades apresentadas acima tornam a RI pouco precisa em suas respostas. Houve a tentativa de amenizar estas dificuldades, que porém não foram resolvidas totalmente. A EI, por sua vez, busca termos pré-definidos que caracterizam o assunto de interesse do

usuário. As palavras e termos encontrados ganham um significado segundo o domínio de

28

GOOGLE Webmaster Central Blog. Disponível em: http://googlewebmastercentral.blogspot.com.br/. Acesso: 08 ago. 2015.

29

Technology Review e Technologyreview.com são publicados por Technology Review Inc., uma companhia independente de meios de comunicação do Instituto de Tecnologia de Massachusetts.

30 Google Tweaks Search to Challenge Apple’s Siri.

Disponível em:

http://www.technologyreview.com/news/519681/google-tweaks-search-to-challenge-apples-siri/ Acesso: 08 ago. 2015.

65

assunto considerado. O Hummingbird se coloca nesta categoria e se destaca pela maneira como interpreta diferentes tipos de consultas, obtendo o real significado atrás de cada termo pesquisado. É uma tecnologia que permite que o software seja capaz de compreender significados, conceitos e as relações por trás do texto que contém informações sobre o assunto pesquisado.

Vivencia-se a era do contexto, a era de uma busca universal. Espera-se que uma busca apresente além dos resultados em texto, elementos como vídeos, imagens e avaliações. Considerando o número crescente de usuários que optam por realizar buscas móveis, destaca- se a importância de um design responsivo (que adapta o conteúdo e a resolução da página conforme o dispositivo), da efetivação de pesquisas por conversação e por voz e melhora na capacidade da ferramenta de busca em entender a que uma pessoa se refere quando realiza uma consulta.

Como declara Ocaña-Sanchez (2013), Page e Brin, criadores do Google, tiveram dois fatores que os tornaram especiais: o primeiro deles foi o desenvolvimento de algoritmos e segundo, uma concepção de serviço baseado no estudo das necessidades e do comportamento dos usuários. Esta preocupação com a inovação e aprimoramento centrados no sujeito, parte do ethos da Google, inspira um diálogo com a Ciência da Informação, mais precisamente com os paradigmas da área que orientam os estudos de usuários.

Ao investigarem a interação homem-computador e sua relação com os paradigmas da Ciência da Informação, Rocha e Sirihal Duarte (2013) descrevem estudos que relatam:

a formulação mental de metas e intenções do ser humano, seguidas da especificação de uma sequência de ações sobre os dispositivos físicos, a execução das ações, a percepção, interpretação e avaliação dos resultados (ROCHA, SIRIHAL DUARTE, 2013).

O deslocamento do foco do sistema para o entendimento dos usuários e a crescente consideração dos fatores humanos no desenvolvimento de interfaces e sistemas também são apontados em uma “onda” de estudos com influência na ciência cognitiva, como ilustra o trecho a seguir:

A importância da eficiência, efetividade, engajamento, tolerância a erros, preocupação com a facilidade de aprendizado, a proposição de diretrizes de design para facilitar a operação de sistemas são todos frutos desta primeira onda (ROCHA, SIRIHAL DUARTE, 2013).

Como dito antes, o Google tem diversos algoritmos, atualizados regularmente. Uma destas últimas atualizações tem causado impacto nos analistas de tecnologia, como deixa

66

entrever a ampla divulgação da mídia. Trata-se de um novo mecanismo empregado para pesquisas feitas no Google através de smartphones. Os resultados irão favorecer apenas os sites cujas interfaces sejam consideradas "amigáveis”. De acordo com o Blog oficial da empresa:

Quando se trata de pesquisa em dispositivos móveis, os usuários devem obter os resultados mais relevantes e oportunos, não importa se a informação está em páginas mobile-friendly ou aplicativos. À medida que mais pessoas usam dispositivos móveis para acessar a internet, nossos algoritmos têm de se adaptar a estes padrões de uso (GOOGLE’S Webmaster Central Blog31, 2015).

Nos últimos anos, observamos a passagem de buscas funcionalistas para a compreensão do usuário conforme seus perfis. As mudanças são particularmente mais focadas em permitir interações cada vez mais complexas e estreitas do utilizador com o motor de busca e consequentemente com a Internet. A natureza destas interações é motivo de divergência na opinião dos autores estudados. Como se mostra adiante há os entusiastas, que acreditam ser esta a tendência a vigorar nas próximas décadas e outros que recomendam cautela na utilização da rede e dos motores de busca.