• Nenhum resultado encontrado

ARQUIVO HISTÓRICO MUNICIPAL DO PORTO Teste de Avaliação de Indexação Resultados das Pesquisas

NOME DO UTILIZADOR:

- Questão:

BASE DE DADOS:

PESQUISAS EFECTUADAS (máximo 20): Ia Pesquisa (sintaxe)

Ns doe. recuperados: N"s reg.:

Mrrelev. Relev. P. Relev. Não Relev.

2a Pesquisa (sintaxe)

NQ doe. recuperados (para além da pesquisa anterior): N"s reg.:

Mt"relev. Relev. P. Relev. Não Relev. Ns doe. repetidos:.

3a Pesquisa (sintaxe)

Ne doe. recuperaeios (para além ela pesquisa anterior): N"s reg.:

Mt" relev. Relev. P. Relev. Não Relev. NB doe. repetidos:.

20a Pesquisa (sintaxe)

Na doe. recuperados (para além da pesquisa anterior): N°s reg.:

Mt"relev. Relev. P. Relev. Nào Relev. N° doe. repetidos:

N° total de doe. recuperados:

Mt" relev. Relev. P. Relev. Nào Relev.. Nfi total de pesquisas efectuadas:

NB total de doe. repetidos recuperados:

Dispositivos de pesquisa utilizados:

Tempo da pesquisa: Obs.:

Todos os números ou datas e todas as palavras ou conjuntos de palavras, susceptíveis de serem pesquisáveis, ou seja, que constituem ponto de acesso, fazem parte de um ficheiro inverso, que é gerado automaticamente pelo próprio programa informático. Este ficheiro inverso é acessível através de um "léxico de pesquisa", que apresenta, numa única sequência (primeiro os caracteres numéricos e depois os alfabéticos) todos os termos, de todos os campos de cada registo, que constituem ponto de acesso. Nesse léxico, são indistintamente ordenados os seguintes termos:

— códigos de referência componentes de cada registo;

— designações completas da "entidade detentora", "grupo de arquivos", "fundo", "secção" e "subsecção" e cada uma das palavras componentes de tais designações;

— títulos das séries e cada uma das palavras que os compõem; — datas registadas nos campos "data inicial" e "data final";

— tipologia documental e cada uma das palavras suas componentes;

— menções de autoria e destinatários completos e cada uma das palavras que compõem tais menções;

— palavras assinaladas entre os sinais <>, no subcampo "assunto/conteúdo", campo "observações" e campo de descrição (em texto livre) da subsérie;

— elementos registados no subcampo Aj relativo à acessibilidade.

Fazem parte também do léxico de pesquisa os códigos de referência prefixados pelo respectivo iden- tificador de nível (ED, GA, F, SC. SSC, SR, SSR, I e P) e as cotas prefixadas pelo identificador "CT"41.

Na base de dados B, foram também incluídos no léxico de pesquisa, os termos de indexação pre- cedidos da abreviatura "AS", a fim de serem distinguidos dos restantes elementos que integram o mesmo léxico. Foram ainda incluídas as datas registadas no campo previsto para esse efeito. Por outro lado, deixaram de figurar no referido léxico as palavras assinaladas entre os sinais <>, porque, como já referimos, não são consideradas ponto de acesso. A pesquisa por assuntos é feita através dos termos de indexação.

No que se refere aos dispositivos de pesquisa, utilizámos no teste apenas aqueles que são de uso mais generalizado e que não implicam conhecimentos técnicos aprofundados sobre o sistema informático. Consideramos que o utilizador comum não tem necessidade de conhecer em porme- nor todos os dispositivos do "software" para realizar pesquisas com sucesso. Ele usa somente os dispositivos vulgares na consulta de bases de dados, até porque esses são os que possibilitam pesquisas mais rápidas. Assim, os dispositivos de pesquisa utilizados foram os seguintes:

— Pesquisa por termo exacto — é indicada ao computador uma sequência de caracteres, que ele vai comparar com os termos do léxico de pesquisa, com a finalidade de ver se há coincidência. Esta pesquisa só produz resultados se se verificar a existência, naquele léxico, de uma sequência de caracteres exactamente igual à indicada.

— Pesquisa por truncatura — faz-se mediante a indicação ao computador de parte de um termo, seguida do sinal $, que indica a truncatura à direita. Este tipo de pesquisa permite a recuperação da informação através de todos os pontos de acesso que têm a mesma raiz, ou seja, que começam por caracteres iguais aos indicados na expressão de pesquisa.

— Uso do léxico de pesquisa — consiste na selecção de um ou mais termos, existentes no léxico de pesquisa, os quais constituem, como referimos, os pontos de acesso à informação. Esta forma de pesquisa é idêntica à pesquisa por termo exacto, só que, em vez de ser indicado um conjunto

" Sobre os elementos componentes do léxico de pesquisa e, portanto, considerados pontos de acesso, ver: FRANQUEIRA, Ana; GARCIA, Madalena - ARQBASE... J» Versão... (o. c, p. 38).

de caracteres para execução da pesquisa, é feita a selecção do "termo exacto" no léxico.

— Uso de operadores booleanos — o "software" permite a construção de expressões de pesquisa bastante complexas, mercê de combinações de termos, ligados pelos operadores booleanos, "E", "OU exclusivo" e "NÃO", expressos pelos sinais *, + e A, respectivamente12.

Estes operadores lógicos possibilitam a obtenção dos seguintes resultados:

— Produto lógico (expresso pelo operador "E") — este resultado consiste na intersecção de dois ou mais conjuntos de documentos, representados por diferentes termos.

Exemplo:

Arrendamento * Propriedade imobiliária

(Os documentos recuperados tratam simultaneamente dos conceitos "arrendamento" e "proprie- dade imobiliária")

— Soma lógica (expressa pelo operador "OU") — este resultado é a reunião de dois ou mais con- juntos, representados por diferentes termos.

Exemplo: Fonte + Chafariz

(Os documentos recuperados tratam do conceito "fonte" ou do conceito "chafariz")

— Diferença lógica (expressa pelo operador "NÃO") — este resultado consiste na exclusão de dois ou mais conjuntos de documentos, representados por diferentes termos.

42 Sobre as diferentes operações lógicas, passíveis de serem realizadas, ver por exemplo: CHAUMIER, Jacques (o. c, p. 51-53).

Exemplo:

Emprazamento A Termo do Porto

Termo do Porto

(Os documentos recuperados tratam do conceito "emprazamento", excepto no "Termo do Porto") Os dispositivos de pesquisa acima referidos foram usados para consultas nas duas bases de dados. Contudo, acresce referir que, na base de dados B, a pesquisa por "termo exacto" foi sempre apoiada pela lista de autoridade, que serve de controlo da linguagem de indexação e de instrumento de apoio à pesquisa, pois é com base nela que se faz a selecção dos termos a pesquisar.

Assim, a escolha dos pontos de acesso por assuntos pode ser feita através de listagem impressa (ver Anexo 5) ou directamente no computador, através da consulta da base "THES", que serve de suporte informático à mesma lista de autoridade.

3.2.4. Condicionantes do teste

Durante a execução do teste, defrontámo-nos com uma dificuldade que se fez sentir em quase todas as questões postas pelos diferentes utilizadores. Referimo-nos à necessidade de limitar cronologicamente os assuntos a pesquisar, dado que a grande maioria dos utilizadores estuda períodos de tempo limitados e pretende seleccionar a informação de acordo com tais períodos.

Quando o período cronológico é coincidente com um século, por exemplo, não há problema em fazer essa restrição, pois basta combinar o termo de pesquisa (assunto) com a indicação do século, truncada, através do operador lógico "E". Contudo, aumenta consideravelmente o tempo de pesquisa, tornando-se, em muitos casos, inaceitável tal demora43.

Exemplo:

COMÉRCIO * 18$

(serão recuperados todos os registos que respeitam a "comércio" no "século XIX") Porém, quando a limitação cronológica se refere, por exemplo, a um período mais restrito, embora distribuído por mais do que um século, a expressão de pesquisa tem de ser muito com- plexa e a busca torna-se, também, muito demorada.

,l O resultado da pesquisa "COMÉRCIO * 18$", por exemplo, demorou 1 hora, 24 minutos e 2S segundos a ser apresentado. O computador utilizado e a respectiva velocidade têm, naturalmente, a sua quota parte de influência nesta demora. No caso concreto, foi usado um computador com processador 80286. disco rígido de 35 Megabytes e velocidade de 10 Mhz.

Exemplo:

Se se pretender recuperar informação relativa à questão "Emprazamento de Propriedades no Porto, excepto nos concelhos do Termo, nos anos de 1580-1640", teremos de cons- truir a seguinte expressão de pesquisa

Emprazamento * Propriedade imobiliária A Termo do Porto + (158$ + 159$ + 160$ + 161$ + 162$ + 163$ + 1640)

Esta complexidade deve-se ao facto de, com os dispositivos vulgares de pesquisa, não ser possí- vel recuperar informação do tipo "posterior a 1580" e "anterior a 1640".

É óbvio que tais questões nada têm a ver com a linguagem de indexação, mas sim com as carac- terísticas do programa informático que serviu de suporte ao nosso estudo. Apesar disso, tiveram influência no teste realizado, sobretudo no que respeita aos tempos de pesquisa, levando-nos, em muitos casos (sobretudo nos séculos XVIII e XIX, que abarcam a maior parte da documentação), a não usar as combinações com datas para abreviar o tempo de resposta. Preferimos não usar combinações cronológicas e, na análise dos resultados de cada pesquisa, ignorar os registos que não deveriam ser recuperados, caso tivessem sido usadas tais combinações.

Este problema implica, necessariamente, estudos a nível informático, com vista a tornar possível executar pesquisas deste género, sem a complexidade e a demora que, de momento, ocorrem.

CAPÍTULO 5