4 Metodologia e resultados
4.2 Metodologia: o processo no on-line e no impresso
A pesquisa foi realizada na web de duas formas diferentes, porém com o mesmo método de levantamento completo dos resultados e não por amostragem.
Por esse motivo o Jornal do Brasil, que estava contemplado no início deste projeto, foi excluído da pesquisa, pois se mostrou irrealizável um método de levantamento completo, já que muitas edições do jornal digitalizado estavam faltando, além do sistema de digitalização não permitir uma busca específica.
Portanto, permanecemos com o levantamento dos acervos digitalizados dos jornais impressos Folha de S. Paulo, O Estado de S. Paulo e O Globo para a listagem de 1981 a 2000 e os resultados gerais da web, sem especificar nenhum jornal ou site, para a lista de livros publicados entre 2001 e 2010. Esta escolha de procedimento foi feita pela coerência do suporte (impresso ou on-line) com a época em que os livros foram publicados.
A pesquisa sobre o período de 2001 a 2010 foi feita com o navegador Chrome e o site de busca Google. É importante destacar esse sistema de busca, pois ele tem impacto direto no resultado da pesquisa. Por exemplo: o Google “salva”
os perfis dos usuários, ou seja, registra quais foram as últimas buscas, os sites mais acessados, tempo de permanência, cliques, entre outros, para criar buscas personalizadas direcionando acessos e publicidade.
Tal condição de busca não invalida a pesquisa, mas é preciso observar os dados tendo em vista essa limitação tecnológica. Um fato a ser notado é que durante a realização do levantamento, várias vezes o Google interrompeu a pesquisa exigindo que um código de verificação fosse digitado, para ter certeza de que o usuário era real e não um robô ou outra pessoa utilizando do mesmo computador, já que a pesquisa divergia das outras buscas realizadas, o que indica a questão da interferência da “busca personalizada” do Google.
A pergunta que se apresenta é: por que diante dessas limitações utilizar o Google para a pesquisa? Por ser o site de buscas mais consultado por usuários de todo o mundo, permitindo que os resultados fossem os mais próximos possíveis dos que outro usuário encontraria se realizasse a mesma pesquisa, sob as mesmas condições, considerando, é claro, a questão da dinamicidade dos conteúdos na web.
Os termos de busca foram: o título do livro ou título mais autor entre aspas.
Dependendo dos retornos, as aspas eram postas apenas no título do livro ou no nome do autor, ou ainda nos dois. Um exemplo dessa busca combinada é o livro Sonho de uma noite de verão de Adriana Falcão. Neste caso não era possível realizar a pesquisa apenas com o título do livro, ou os retornos seriam mais relacionados a Shakespeare do que à obra em questão. Para este caso e semelhantes a este foi utilizado o recurso de combinar o nome do autor com o título, ambos entre aspas.
Caso os resultados fossem poucos ou insatisfatórios, ou seja, resultados de agenda, notas de lançamento ou citações apenas do nome do autor, realizava-se novamente a busca colocando o nome do livro entre aspas e o autor livre, ou ainda combinando os dois sem aspas. Mas, mesmo com essas variações de busca muitos retornos foram insatisfatórios ou nulos, somando ao todo nove livros da lista que não obtiveram nenhum resultado.
A pesquisa levou em conta cada retorno, sendo registrados aqueles que eram possíveis de visualizar, considerando que muitos sites de jornais exigem assinatura depois da visualização de um número determinado de matérias.
Os resultados foram compilados em uma planilha de Excel, onde foi feita uma tabulação dos dados, posteriormente os textos completos foram transferidos para documentos do Word. Nestes casos, não foi possível localizar novamente alguns textos, outros não foi possível visualizar, devido à questão da assinatura.
Já o levantamento realizado com a listagem de livros no período de 1981 a 2010 foi feita através dos acervos digitalizados dos jornais O Estado de S. Paulo, Folha de S. Paulo e O Globo. Para tais foi feito um recorte temporal de até três anos após a publicação dos romances. Todos os três acervos são disponibilizados on-line pelos próprios jornais e o acesso a estes é permitido mediante assinatura.
Todos os três trabalham com sistemas similares de busca, nos quais existe um campo onde é possível digitar o nome do livro ou nome do autor e buscar resultados específicos para estes. É claro que muitos dos resultados não foram tão objetivos quanto podem aparentar pela descrição do sistema. Muitos acabavam sendo errôneos, pois buscavam apenas o nome do autor. Por exemplo, no caso de João Ubaldo Ribeiro, todas as pessoas que se chamavam João acabavam aparecendo como retornos da pesquisa. Por isso, em muitos casos foi necessário combinar o nome do autor, com o livro e a década específica que se pretendia pesquisar, já que nenhum dos três jornais apresentava a opção de busca por caderno ou editoria, o que talvez ajudasse na dinâmica do sistema de busca.
O acervo digital do Estadão foi o que mais se destacou pelo sistema de busca que tende a agilizar o processo de pesquisa para o usuário, já que apresenta ao lado do retorno uma prévia da página digitalizada, o que auxilia na hora de verificar se aquele retorno é válido, ou seja, se é sobre o João Ubaldo Ribeiro, ou sobre outro João.
Já O Globo exige que para verificar se o resultado é válido tenha-se que visualizar cada página digitalizada, o que não dinamiza tanto o processo de pesquisa, mas também não se torna uma grande dificuldade.
Em contrapartida, porém, a Folha apresentou o pior sistema de busca no qual o usuário precisa passar por mais de cinco etapas diferentes para conseguir visualizar a página digitalizada, sem contar os erros de classificação da própria Folha, que indicam que determinada página se encontra na editoria de “Informática”, por exemplo, quando na verdade esta pertence à “Ilustrada”, ou ainda números de páginas erroneamente indicados, baixa qualidade de digitalização de muitas páginas, entre outros. Mas, apesar dos problemas, não impossibilitou a realização da pesquisa, ao contrário do Jornal do Brasil, que simplesmente não permitia um método de levantamento completo, exigindo uma pesquisa por amostragem, já que não permitia a busca por nenhum termo específico, apenas a visualização das
edições digitalizadas. Além disso, seu acervo, disponível gratuitamente, possui muitas lacunas, muitas edições faltando, às vezes meses ou anos inteiros.
Tendo apresentado o processo de pesquisa e todas as características e peculiaridades com que tivemos que trabalhar com o objeto da pesquisa podemos passar para os resultados.