• Nenhum resultado encontrado

2.3 Difusão do conhecimento

2.3.2 Organização do conhecimento

A mais antiga biblioteca de que se tem notícia data de 5.000 anos atrás, a Biblioteca de Ebla, na Síria, descoberta em 1974 (ORTEGA, 2002, p. 14). A coleção era composta de textos ad- ministrativos, literários e científicos, registrada em 15.000 tábuas de argila, dispostas criteriosa- mente em estantes segundo o tema abordado. Também foram encontrados 3 grandes dicionários e 15 tábuas pequenas de argila com resumos de conteúdo dos documentos.

Desde então parte do que o homem vem produzindo em termos de registro de informações passa por algum tipo de organização, para mais tarde ser recuperada e eventualmente reutilizada. Mas o volume da informação documentada aumentou consideravelmente, e vem crescendo rapi- damente nos últimos tempos, tornando-se urgente automatizar diversas tarefas e procedimentos necessários ao ciclo documentário. Métodos para recuperação de informações usam diretamente os esquemas de classificação para localizar informações específicas na massa documental, onde se pode considerar qualquer registro como um tipo de representação, artificialmente criado para facilitar a comunicação entre os homens.

A representação constitui, portanto, um processo que, inerente à natureza hu- mana num primeiro momento, se torna, em seguida, social, em suas caracte- rísticas. Em outras palavras, o ser humano possui a necessidade e prerrogativa intrínsecas de pensar, conhecer, registrar e comunicar, sendo que a atividade de registrar serve não só à concretização/fixação do conhecimento em determinado suporte, como também à necessidade de comunicação e compartilhamento de idéias, esta também inerente à natureza humana (BAPTISTA, 2007, p. 180).

O Quadro 2.1 mostra em maior detalhe como usamos diversos níveis e camadas de repre- sentação dos elementos do mundo, os quais são baseados no desenvolvimento e utilização de metalinguagens, na medida em que o objeto precisa ser não somente representado como também transformado em recurso informacional, como elemento constitutivo básico do conhecimento.

Hoje, com o aparecimento de novas infra-estruturas, os sistemas de classificação e, junto, as metalinguagens, estão se tornando cada vez mais conectados. Esta integração começou em torno da metade, e floresceu ao final, do século XIX, com o aparecimento dos sistemas de padronização para o comércio internacional, e também por razões sanitárias, para o controle de epidemias. A partir daí, e paulatinamente, os sistemas locais vêm dando lugar a esquemas padronizados mundialmente, e que estão alinhados com esquemas mais abrangentes ainda. Neste processo

Origem Representação 1 Representação 2 Representação 3 Pensamento como matéria-prima. Concretização/fixação do pensamento em um objeto. Representação do objeto. Identificação e loca- lização do registro. Processo cognitivo. Passagem do abs-

trato para o con- creto.

Passagem do con- creto para o simbó- lico.

Processamento do registro; do sim- bólico 1 para o simbólico 2.

Elaboração mental. Linguagem como expressão do pensa- mento.

Linguagem docu- mentária.

Metalinguagens.

Informação não re- gistrada; Informação em estado bruto. Informação regis- trada. Transformação do objeto em recurso informacional. Informação eti- quetada; virtual; controlada. Conhecimento indi- vidual. Conhecimento exte- riorizado. Transferência do co- nhecimento. Multiplicação do co- nhecimento. Fonte: Baptista (2007, p. 181) QUADRO2.1. Representação do conhecimento.

fica muito fácil para um indivíduo agir e se perceber como parte natural de uma “Sociedade da Classificação”, uma vez que o sistema classificatório é tanto operativo – pois define e limita as possibilidades de ação –, quanto obviamente descritivo. À medida que nos socializamos vamos também nos tornando aquilo que pode ser medido pelas nossas ferramentas de medida e, assim, as classificações também vão se naturalizando em maiores escopos. Por essas razões, Bowker e Star (2000) recomendam o desenvolvimento de esquemas de classificação mais flexíveis, cujos usuários estejam conscientes das implicações políticas e organizacionais de seu uso, e ainda que retenham os traços de sua construção, garantido sua história. Esse é o fruto do aprendizado com erros do passado, e é uma chave para o futuro, assim como a forma de mantermos um sistema documentário vivo. Por isso, o aparecimento da informática deve ser visto como uma oportunidade para a renovação de conceitos e mudanças de atitudes. Os avanços tecnológicos modificam o conceito e o uso da informação, e estes, por sua vez, influenciam a estruturação do conhecimento.

Os sistemas de informação precisam colocar o usuário como a razão fundamen- tal dos serviços de informação, como parte integrante do sistema, levando-se em consideração sua motivação pessoal, orientação profissional, contexto so- cial, político, econômico, cultural, ou seja, tudo o que o afeta de maneira indi- vidual e profissional. A perspectiva de um olhar global e justo sobre o acesso

à informação resultará em benefícios na participação de todos na sociedade da informação (UNGER; FREIRE, 2008, p. 107).

Sistemas de informação são produtos do conhecimento e estão sujeitos a estas transforma- ções, sendo necessário imaginar e construir estruturas de dados cada vez mais especializadas para facilitar o acesso à informação armazenada. Uma estrutura de dados simples é uma coleção de itens selecionados, cada um deles associados a etiquetas, ou ponteiros, chamados índices, que se relacionam diretamente com a informação contida em cada item. Ainda que o acesso completo ao conjunto de significados detidos por um documento não seja factível, pode ser conseguido um controle descritivo e formal, baseado em índices formais e no controle temático dos documentos, que busca oferecer o acesso controlado por assunto. Este último recurso porém, uma vez que se baseia em julgamentos subjetivos, está sujeito a uma complexa adequação aos códigos adotados pelo sistema.

[...] as leis da cibernética, em especial a da regulação e a do controle, apon- tam para a possibilidade, ainda que teoricamente, de obtenção plena do controle bibliográfico descritivo, no qual os substitutos dos documentos podem receber controle rígido, governado por regras aceitas internacionalmente, e para a im- possibilidade da execução completa do controle bibliográfico por assunto, uma vez que esse depende da adequação da linguagem natural (criativa e repleta de significado) à linguagem documentária (artificial e redutora de significado) (MACHADO, 2003, p. 143).

Vannevar Bush (BUSH, 1945), anteviu a automatização da indexação de documentos e tam- bém formalizou a idéia de filtragem, que vem inspirando todos os sistemas de recuperação de informação desde então. No entanto, somente a partir do final dos anos 1970, com a popula- rização do uso dos minicomputadores em bibliotecas e em outros sistemas de informação, foi possível implementar processos eficientes e automatizados de filtragem em texto. Conseqüente- mente, para a disseminação de objetos documentais, as possibilidades de indexação e a amplitude no alcance de público foram enormemente reforçadas.

O processo de difusão do conhecimento está diretamente relacionado a fatores contextuais e cognitivos, assim a distribuição e uso/consumo eficientes da informação estão condicionados aos diferentes espaços sociais nos quais se pretenda que a informação circule:

Nos sistemas de informação é fundamental a incorporação da inteligibilidade aos esquemas de transmissão da informação A inteligibilidade das mensagens,

isto é, as negociações sobre o sentido da informação, está presente na teoria da comunicação. Se, no processo de comunicação, ainda que segundo o tradicional esquema linear, a mensagem é composta por um sistema simbólico, então é evidente a necessidade de um certo cuidado ao se representar a informação. Se diferentes pessoas utilizam o sistema, ele deve procurar atender às diferentes demandas em seus diferentes níveis de compreensão/absorção da mensagem. De forma mais simples, o que pretendemos explicitar é que a mensagem precisa ser construída de forma compreensível e para que tal compreensão seja efetiva é necessário respeitar a origem, os laços sociais, a cultura e o contexto no qual se insere o indivíduo (SOUTO, 2006, p. 62).

Por isso é preciso uma atenção especial na construção de um Sistema de Recomendação, ainda mais quando é uma tentativa de substituir por mecanismos automáticos uma das etapas básicas que constituem os serviços de Disseminação Seletiva de Informações tradicionais, qual seja a criação de perfis pelos usuários.

Disseminação Seletiva de Informações

A DSI é um serviço bibliotecário com o objetivo de encaminhar, periodicamente, uma rela- ção dos materiais contidos em seu acervo cuja temática coincida com os interesses dos usuários cadastrados no serviço. Para isso, as etapas de seleção, análise e indexação são necessárias na identificação dos documentos que serão divulgados. Além disso, é preciso que o usuário declare pessoalmente suas preferências e área de atuação preenchendo algum tipo de formulário. O per- fil de interesses é um mapeamento das necessidades informacionais do usuário e possibilita a seleção dos itens que preenchem os requisitos definidos. Funciona como um filtro que direciona de forma personalizada a informação relevante, por meio de critérios de convergência entre as referências e os interesses dos usuários; assim, os usuários são notificados sempre que um novo título em uma dada área de pesquisa é publicado.

A forma atual de realizar a disseminação seletiva utiliza a Internet constituindo os chamados sistemas de recomendação, que utilizam diversos mecanismos para completar um perfil perso- nalizado de cada usuário, com sua ajuda consciente ou pelo levantamento de suas atividades na rede, como será visto na seção 2.3.3.

Com o sistema de recomendação aqui proposto se procura eliminar o levantamento do perfil individual, transferindo esta tarefa para um agente (de software) de prospecção, capaz de avaliar elementos semânticos contidos no texto de um site, e dele extrair um perfil de preferências. Neste

trabalho os perfis serão extraídos automaticamente a partir do corpo de texto presente em sites institucionais que, espera-se, representem assim os interesses dos grupos de usuários e autores de tais sites. A seguir estes grupos serão notificados da existência de documentos audiovisuais que, presumidamente, abordam uma temática de seu interesse. Também no trabalho de Bax et al. (2004) se propõe um sistema de disseminação seletiva automática mas ainda com a necessidade de formalização de um perfil pelos usuário.

Para melhor entendimento da metodologia tradicional reproduzimos, a seguir, alguns trechos da seção sobre a DSI constante em uma publicação de 2001, do SERPRO61, Serviço Federal de Processamento de Dados, o órgão governamental dedicado à prestação de serviços em Tecnolo- gia da Informação e Comunicações para o setor público e, por extensão, a questões levantadas pela informatização na sociedade brasileira.

As etapas do processo de operacionalização de um serviço de DSI são:

1. levantamento do perfil de interesse dos usuários – descrição detalhada da qualificação, especialidade, necessidades e interesses dos usuários; 2. análise e tradução dos perfis – atribuição de descritores, palavras-chave e

códigos legíveis pelo sistema, que representem os temas a serem recupe- rados;

3. arquivamento dos perfis – armazenamento no sistema dos perfis dos usuá- rios, para processamento automatizado;

4. recuperação da informação – realizada por computador, pelo confronto dos perfis dos usuários com a base de dados;

5. controle de qualidade – verificação realizada para teste dos resultados, a fim de identificar possíveis erros de estratégia e de linguagem;

6. expedição aos usuários – envio das listagens e ficha de avaliação, após os controles de expedição.

[...]

O próximo passo é o levantamento, realizado pelo preenchimento de formulário pelo próprio usuário, onde são registrados seus dados cadastrais (nome, unidade, telefone, e-mail, etc.) e dados temáticos (indicadores para facilitar a estratégia de busca e o desenvolvimento do vocabulário, como uma síntese descritiva sobre a pesquisa, produto, serviço, processo, área de negócio, que possibilite a delimi- tação do campo de interesse; descritores; referências bibliográficas relevantes; etc).

Por último, deve-se prever ações para a identificação de erros, ocasionados por perfis mal elaborados. É comum, os usuários por desconhecimento das bases de dados, formularem perfis que resultam em (a) uma solicitação maior que a necessidade real; (b) uma solicitação menor que a necessidade real; (c) uma

solicitação defasada da necessidade real; (d) uma solicitação não coincidente com a necessidade real.

[...]

A análise dos perfis consiste na separação dos grupos lógicos, conectados por operadores booleanos (E, OU, NÃO) e no estabelecimento da estratégia de busca. O desenvolvimento do vocabulário consiste em ajustar a terminologia do usuário à terminologia do sistema, que pode ser livre ou controlada por uma lista de termos, tesauro, etc. A codificação representa o registro dos perfis já analisados. A digitação e o arquivamento dos perfis consiste na inserção dos perfis no sistema.

[...]

Implantar um serviço de disseminação seletiva da informação é uma das formas de gerenciar o conhecimento empresarial, uma vez que provoca a organização e o uso intensivo da informação e do conhecimento relevantes de forma adequada, sem desperdício de tempo e esforço por parte dos usuários. Um serviço de DSI planejado e funcionando em conformidade com a estratégia e objetivos corporativos estimula a criatividade e a inovação, contribuindo para o êxito do processo de aprendizagem organizacional (SANTOS et al., 2001, p. 201).

A aplicação destes parâmetros e sua adequação às necessidades da pesquisa serão discutidas na seção 4.3. Já se demarcou a dispensa da etapa de construção do perfil por parte do usuário no sistema proposto, no qual estes perfis serão obtidos por agentes que farão a sumarização de conteúdo em sites selecionados.

Minimizando o viés empresarial do texto acima, se reconhece que a criatividade, a inovação e a aprendizagem estão diretamente relacionadas à circulação e uso adequado do conhecimento, em qualquer esfera da sociedade. Neste mundo de alta rotatividade de conceitos e atitudes, marcado pelas relações econômicas e diferenças sociais extremas, se justifica a preocupação com a deterioração da memória coletiva, que deixa conseqüências semelhantes a da degradação da memória individual: a perda da identidade própria e das referências existenciais. É preciso mais do que nunca incentivar o acesso irrestrito à informação e assim dificultar a submissão da transmissão do conhecimento aos critérios econômicos de rentabilidade, o que leva a um estado de perda do acesso da maioria da população à educação de qualidade. Máquinas nada mais são que um “conhecimento entranhado na matéria” (XAVIER; MATTOS, 2007, p. 1); dessa forma, o próprio conhecimento pode ser produzido, distribuído e comercializado, gerando preços, estoques e custos.

As conseqüências desse processo de privatização da informação são diversas: a informação deixa de ser um bem acessível às classes sociais com níveis de

renda diferenciados, para ser submetida a leis do mercado; somente os países, as empresas e as pessoas mais ricas terão acesso às informações de qualidade, o que tanto aumentará a distância social entre ricos e pobres quanto ampliará o poder dos economicamente incluídos; os países pobres serão dependentes da tecnologia dos países ricos, enviando dados brutos e importando dados elabo- rados; empresas que não tiverem acesso a essas grandes bases de dados, ou serão dependentes da lógica econômica daquelas que têm, ou não perpetuarão; pesquisadores que não tiveram acesso a esses acervos privados terão mais pro- blemas em levar adiante suas pesquisas do que aqueles que têm; somente as informações de preços elevados serão contempladas nesses grandes distribui- dores privados, deixando a área de humanidades de lado, isso resultará numa brutal perda na História da humanidade.

Tais conseqüências da privatização, tanto no campo da infra-estrutura quanto do conteúdo propriamente, exigem a atuação governamental sobre novas políticas de acesso à informação, o que deveria estar contemplado ao lado do direito à educação para todos. Caso não se reverta esse quadro a tempo tem-se um fu- turo pouco promissor, produzido pelo acesso limitado, caro e complicado das informações (XAVIER; MATTOS, 2007, p. 16).

Esta é a grande motivação para o esforço na pesquisa por um esquema de classificação con- sistente e robusto que, em um contexto de sobrecarga informacional, tem levado muitos cientistas da informação à busca pela automatização dos processos no ciclo documentário. A categorização automática torna-se possível à medida que humanos indexem previamente uma coleção signifi- cativa de documentos, para que então máquinas possam extrair padrões que indiquem como indexar novos documentos. A própria estrutura e a variedade de recursos da rede impõem novos parâmetros para o tratamento de documentos.

Para Rocha (2004), a catalogação tradicional, através da utilização de esquemas como MARC62, um dos formatos mais utilizados em tarefas bibliográficas, também não se aplica na Web, pois esta abrange outros tipos de recursos, além daqueles tradicionalmente catalogados em bibliotecas, como, por exemplo, páginas de pessoas, páginas de organizações, páginas que são sistemas operacionais, páginas que representam produtos, lojas virtuais, etc. Além disso, a Web envolve comunidades diferentes daquelas que tradicionalmente usam bibliotecas, como consu- midores, que necessitam adquirir um produto, ou cidadãos, que necessitam algum serviço de um governo. Estas comunidades são formadas por pessoas que não são especialistas em catalogação, mas esperam encontrar facilidades para descobrir e usar os recursos em rede.

Assim, no cruzamento entre os sistemas inteligentes de classificação e as necessidades in-

formacionais dos usuários da Web, surgem os sistemas de sugestão, ou recomendação, que são o objeto de estudo da seção seguinte.