Período 1:
Introdução
Recuperação de Informação: Definição
Calvin Northrup Mooers 1919 - 1994
2
Definição
Recuperação de informação é o nome dado ao processo
ou método pelo qual um potencial usuário de informação é capaz de converter a sua necessidade de informação em uma lista real de citações a documentos em um acervo contendo informações úteis
para ele.
[...]
Recuperação de informação abrange os aspectos intelectuais da descrição da informação e sua especificação para a busca, e também quaisquer sistemas, técnicas ou máquinas que são utilizadas para realizar a operação.
[...]
O assunto de cada documento ou outra unidade de
informação é caracterizado ou descrito por meio de um conjunto de "descritores“ tirado de um vocabulário formal de tais termos. Uma “lista de
cabeçalho de assuntos” remeterá a uma aproximação grosseira do seu significado.
(MOOERS, 1951, p.25)
Definição
Recuperar informação consiste em identificar, em um conjunto de documentos, quais atendem à uma determinada necessidade de informação do usuário.
Envolve:
◦ um acervo documental;
◦ pessoas que buscam por documentos relevantes para satisfazer suas necessidades de informação.
Implica em operar seletivamente um estoque de informação
◦ processos difíceis de serem formalizados
A utilização de recursos computacionais nessa tarefa parte de inevitáveis simplificações teóricas e de adequações de conceitos subjetivos
◦ relevância
◦ necessidade de informação ◦ informação
Definição
A recuperação de informação se efetiva por meio da comparação
entre as representações dos documentos de um acervo e a representação da necessidade de informação do usuário que
busca por documentos que venham a atender tal necessidade.
Um documento é recuperado se a sua representação coincidir total ou parcialmente com a representação da necessidade do usuário.
Cada documento é representado por um conjunto de termos (termos de indexação) que têm como objetivo sintetizar o seu conteúdo informacional.
O usuário que traduz a sua necessidade por meio da especificação de um conjunto de termos (termos de busca).
Meio Ambiente da Recuperação da Informação
4
Língua e Linguagem
Chamamos “língua” um sistema programado em nosso
cérebro que, essencialmente, estabelece uma relação
entre os esquemas mentais que formam nossa
compreensão do mundo e um código que os
representa de maneira perceptível aos sentidos. Os
seres humanos utilizam um grande número de tais
sistemas (“línguas”), que diferem em muitos aspectos e
também se assemelham em muitos outros aspectos.
[...]
(PERINI, 2010)
Língua e Linguagem
O sistema em questão é de uma complexidade
extrema: compreende regras (de pronúncia, de
formação de palavras, de formação de frases, de
relacionamento das formas com os significados),
itens léxicos (palavras e morfemas, com suas
propriedades gramaticais e seus significados),
expressões idiomáticas (como pisar na bola) e
clichês (como ficar sem fala).
Analógico x Digital
Na sociedade contemporânea o processo de
digitalização expande-se a velocidades crescentes com
pretensão de universalidade. Afirma-se até mesmo que
vivemos em um mundo digital, no qual se instaura a vida
digital.
O caráter eminentemente informático desse processo
se articula com a concepção de que o germe de todo
conhecimento e poder é a informação, devidamente
organizada armazenada e, enfim, distribuída.
(TENÓRIO, 1998, p.1)
Analógico x Digital
Binária, a informática? Sem dúvida, em um certo
nível de funcionamento de seus circuitos, mas faz
tempo que a maioria dos usuários não mais tem
qualquer relação com esta interface. Em que um
programa de hipertexto ou de desenho é ‘binário’?
6
Vídeo
O Sentido da Vida
Vídeo
Suporte Técnico
As interfaces da Escrita
(LÉVY, 1993)
A impressão à primeira vista é sem dúvida um
operador quantitativo, pois multiplica as cópias.
Mas representa também a invenção, em algumas
décadas, de uma interface padronizada
extremamente original: página de título,
cabeçalhos, numeração regular, sumários, notas,
referências cruzadas.
Todos esses dispositivos lógicos, classificatórios e
espaciais sustentam-se uns aos outros no interior
de uma estrutura admiravelmente sistêmica.
8
Livro
Segmentação do saber em módulos;
Páginas uniformemente numeradas;
Sumários e índices;
Exame rápido do conteúdo;
Acesso não linear e seletivo ao texto;
Conexões a outros escritos (bibliografia)
Jornal
Adaptados a uma atitude de “atenção flutuante”;
No território quadriculado do livro precisamos
de índices, sumários, etc.
O leitor do jornal realiza diretamente uma
navegação a olho nu;
As manchetes chamam a atenção, dando uma
primeira ideia, pinçam-se aqui e ali algumas frases,
uma foto e, de repente, encontramos algo que
nos atrai.
10
Revista
Computador
Pacote terrivelmente redobrado, com pouquíssima
superfície que seja diretamente acessível em um mesmo
instante. A manipulação deve então substituir o sobrevoo.
Ferramentas
◦ Tela gráfica;
◦ Representação icônica (figurada) das estruturas de informação e dos comandos;
◦ Uso do mouse, permitindo agir sobre o que ocorre na tela; ◦ Menus que mostram as operações que se pode realizar;
Computador
12
Web
utilização média de endereços IPv4
Informação
Shannon e Weaver (1949, p.3) definem
informação como:
O que acrescenta algo a uma representação [...]
Recebemos informação quando o que
conhecemos se modifica. Informação é aquilo que
logicamente justifica alteração ou reforço de uma representação ou estado de coisas.
Esta definição, base da Teoria da Informação, foi
fundamental na construção dos primeiros
computadores eletrônicos.
Teoria Matemática da Comunicação
(Teoria da Informação)
Estou bem
País 1
País 2 Estou bemEstou mal Meu fim está próximo
14
Informação
Segundo Ruyer, (1972, p. 3):
A palavra ’informação’, em seu sentido usual, parece comportar, necessariamente, um elemento de consciência e de
sentido. [...] A informação, no sentido habitual do termo, é a transmissão a um ser consciente de uma significação, de uma noção, por meio de uma mensagem com base em um suporte espaço-temporal: imprensa, mensagem
telefônica, onda sonora, etc.
Informação
Xifra-Heras, 1974 (p. 26)
◦
Sem dúvida, informar é dar uma forma ou um
suporte material a uma vivência pessoal ou a
uma imagem mental do emissor; mas não é só
isso. O suporte ou forma necessita de associar-se a uma
série de signos ou símbolos convencionais que
objetivem tal forma, de modo a torná-la transmissível.
O sujeito ativo transforma a imagem mental formalizada
(mensagem) numa série de signos (codificação) que se
transmitem para serem decifrados e interpretados pelo
sujeito receptor.
Informação e linguagem
Segundo Berlo (1997, p. 170)
◦
A linguagem é um sistema e compreende
elementos e estruturas. Como em qualquer sistema,
podemos definir as unidades elementares e estruturais
em muitos níveis, conforme o objetivo. Em qualquer
nível, todavia, a linguagem abrange um conjunto de
símbolos (vocábulos) e métodos expressivos de
combinar essas unidades (sintaxe).
Informação e comunicação
Rector e Neiva (1995, p. 12)
◦
A comunicação não é um termo e conceito isolado, mas
precisa ser considerado juntamente com informação e
significação. Comunicação só é possível gerada
pela informação e esta se supõe (e implica) que
seja significativa.
Wurnan (1991, p.138)
◦
A informação é a matéria-prima que alimenta
toda a comunicação, pois a motivação básica de
qualquer comunicação está em transmitir de uma
mente para outra algo que será recebido como
16
Informação e conhecimento
Araújo (2002, p. 13)
◦ [...] quando se afirma que existe uma relação entre informação e
conhecimento e que estes elementos podem provocar
transformações nas estruturas, estamos nos baseando na ideia de
que o nosso estado (ou nossos estados) de conhecimento sobre determinado assunto, em determinado momento, é representado por uma estrutura de conceitos ligados por suas relações; isto é, a nossa imagem do mundo, ou nossa visão de mundo. Quando constatamos
uma deficiência ou uma anomalia desse(es) estado(s) de conhecimento, encontramo-nos em estado anômalo de conhecimento. Ao tentarmos obter uma informação ou informações que corrigirão essa anomalia, criaremos um novo estado de conhecimento, que uma vez aplicado a determinada situação problemática, pode provocar uma nova situação ou uma transformação de estruturas.
Informação como coisa
Buckland (1991) identifica três principais usos do
termo “informação”:
◦ Como processo - o ato de informar ou a comunicação do
conhecimento ou notícias sobre um fato ou ocorrência;
◦ Como conhecimento - o que é percebido pela informação
enquanto processo, o conhecimento comunicado. Sua principal característica é a intangibilidade;
◦ Como coisa - aquilo que é visto como informativo: objetos,
documentos, textos, dados ou eventos. A sua principal característica é a tangibilidade, sua materialidade.
A “informação como coisa” possui papel fundamental
em sistema de recuperação de informação.
Informação como coisa
McGarry (1999, p. 11)
[...] a informação deve ser ordenada, estruturada ou
contida de alguma forma, senão permanecerá amorfa e
inutilizável. [...] A informação deve ser representada para
nós de alguma forma, e transmitida por algum tipo de
canal. [...] a informação documentária pode estar contida
em qualquer coisa que uma pessoa escreva, componha,
imprimam desenhe ou transmita por meios similares.
Martínez Comeche (1998, p. 58)
[..] a informação apoia-se em um suporte,
independentemente do seu tradicionalismo milenar, visto
que qualquer mensagem precisa de um suporte para ser
transmitida, premissa básica para sua “utilidade informativa
A Ciência da Informação
Harold Borko
18
Ciência da Informação
A Revolução Industrial;
Novas invenções se seguiram durante o século XIX, a maioria delas ligadas à transmissão de informação.
◦ 1820 - desenvolvimento da fotografia
◦ 1840 - John Benjamin Dancer combinou a fotografia com a microscopia e se tornou o pioneiro da microfotografia e da microfilmagem.
◦ 1843 - Alexander Bain patenteou o primeiro aparelho de fax da história.
◦ 1876 - Alexander Graham Bell patenteou o seu telefone.
◦ 1877 - Thomas Edison criou a primeira máquina de gravar sons e em 1879 projetou a lâmpada elétrica.
Início do século XX - Paul Otlet apresenta o termo “Documentação” Em sua obra Paul Otlet mostra-se interessado em toda novidade tecnológica que permita condensar e organizar a informação de acordo com suas necessidades e objetivos
Ciência da Informação
Paul Otlet
Ciência da Informação
Disciplina que investiga as propriedades e o comportamento da
informação, as forças que regem o fluxo da informação e os meios de processamento da informação para acessibilidade e usabilidade ótimas. Está relacionada com o corpo de conhecimento que abrange a
origem, coleta, organização, armazenamento, recuperação, interpretação, transmissão, transformação e utilização da informação. Isto inclui a investigação das representações da informação nos sistemas naturais e artificiais, o uso de códigos para a transmissão eficiente de mensagem, e o estudo dos dispositivos e técnicas de processamento de informação tais como computadores e seus sistemas. É uma ciência interdisciplinar derivada
de e relacionada a vários campos tais como matemática, lógica, linguística,
psicologia, tecnologia da computação, pesquisa operacional, artes gráficas, comunicações, biblioteconomia, administração e outros campos similares.
Possui um componente de ciência pura, que investiga o assunto sem considerar suas aplicações, e um componente de ciência aplicada, que desenvolve serviços e produtos. (BORKO, 1968, p. 3).
Ciência da Informação
[...] a Ciência da Informação é um campo dedicado às
questões científicas e à prática profissional voltadas para
os problemas da efetiva comunicação do
conhecimento e de seus registros entre os seres
humanos, no contexto social, institucional ou individual
do uso e das necessidades de informação. No tratamento
destas questões são consideradas de particular interesse
as vantagens das modernas tecnologias informacionais.
20
A Ciência da Computação e sua relação com a Ciência da Informação
Ciência da Computação
Denning et al (1989, p. 12)
[…] o estudo sistemático de processos algorítmicos que descrevem e transferem informação: sua teoria, análise, projeto, eficiência, implementação e aplicação. A questão fundamental de toda a computação é: ‘O que pode ser (eficientemente) automatizado.
Fonseca Filho (1999, p. 13)
[...] um corpo de conhecimento formado por uma
infraestrutura conceitual e um edifício tecnológico onde se materializam o hardware e o software. A primeira fundamenta a segunda e a precedeu.
Information Retrieval
Termo criado em 1951 por Calvin Mooers:
Recuperação de informação é o nome para o processo oumétodo pelo qual um potencial usuário de
informação é capaz de converter a sua necessidade de informação em uma lista de citações a
documentos armazenados contendo informações úteis a ele. [...]. Recuperação da informação abrange os
aspectos intelectuais da descrição das informações e sua especificação para a busca, e também qualquer sistema, técnica ou máquinas que são utilizadas para realizar esta operação. Recuperação da informação é crucial para documentação e organização do conhecimento (Mooers, 1951, p. 25).
Information Retrieval
A Recuperação de Informação se firmou como
uma área de pesquisa autônoma no seio da
Ciência da Computação, com um acelerado
desenvolvimento.
Para Saracevic (1999), a Recuperação de
Informação pode ser considerada a vertente
tecnológica da Ciência da Informação e é
resultado da relação desta com a Ciência da
Computação.
22
Informação x Computação
Ciência da Informação Ciência da Computação Recuperação de Informação Sugestão de LeiturasSugestão de Leituras
SARACEVIC, T. RELEVANCE: A Review of and a
Framework for the thinking on the Notion in Information
Science. Journal of the American Society for
Information Science, nov-dec, 1975.
MIZZARO, Stefano. Relevance: the whole history. Journal
of the American Society for Information Science,
v.48, n.9, 1997
24
Referências
ARAÚJO, E. A. de. O fenômeno informacional na Ciência da Informação: abordagem teórico-conceitual. In: CASTRO, C. A. (Org.). Ciência da Informação e Biblioteconomia: múltiplos discursos. São Luís: EDFMA; EDFAMA, 2002. p. 11- 34.
BERLO, D. K. O processo da comunicação: introdução à teoria e à prática . 8ª ed. São Paulo: Martins Fontes, 1997.
BORKO, H. Information Science: What is it? American Documentation, v. 19, n. 1, 1968. p.3-5. BUCKLAND, M.K. Information as thing. Journal of the American Society of Information
Science, v.42, n.5, 1991. p.351-360.
DENNING, P.J. et al. Computing as a discipline. Communication of the ACM, v. 32, n. 1, 1989. p.9-23.
FONSECA FILHO, C. História da computação: teoria e tecnologia. São Paulo: LTr, 1999. LÉVY, Pierre. As tecnologias da Inteligência. Rio de Janeiro: Editora 34, 1993. MARTÍNEZ COMECHE, J. A. El documento y las nuevas tecnologias: hacia una definición integradora. Investigación Bibliotecológica, v. 12, n. 25, p. 51-63, jul./dic. 1998.
McGARRY, K. O contexto dinâmico da informação: uma análise introdutória. Brasília: Briquet de Lemos, 1999.
MOOERS, C. Zatocoding applied to mechanical organization of knowledge. American
Documentation, v.2, n.1, 1951, p.20-32.
Referências
PERINI, Mário A. Sobre língua, linguagem e Linguística: uma entrevista com Mário A. Perini. ReVEL, v.8, n.14, 2010.
RECTOR, M.; NEIVA, E. (Org.) Comunicação na Era Pós Moderna. 2º ed. Petrópolis: Vozes, 1995.
RUYER, R. A cibernética e a origem da informação. Rio de Janeiro: Paz e Terra, 1972. SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectivas em Ciência da
Informação, v.1, n.1, 1996, p.41-62.
SARACEVIC, T. Information Science. Journal of the American Society for Information
Science, v.50, n.12, 1999, p.1051-1063.
SHANNON, C. ; WEAVER, W. The MathematicalTheory of Communication. University of Illinois Press, 1949.
TENÓRIO, R.M. Cérebros e Computadores: a complementariedade analógico-digital na informática e na educação. São Paulo: Escrituras Editora, 1998.
WURMAN, R. S. Ansiedade de informação: como transformar informação em compreensão. São Paulo: Cultura, 1991.
XIFRA-HERAS, J. A informação: análise de uma liberdade frustrada. Rio de Janeiro: Lux; São Paulo: EDUSP, 1974.