• Nenhum resultado encontrado

A análise do conteúdo documental: identificação e selecção dos conceitos representativos do mesmo conteúdo

A INDEXAÇÃO POR ASSUNTOS APLICADA À ARQBASE: O USO DE IJNGUAGEM CONTRO LADA

3. A análise do conteúdo documental: identificação e selecção dos conceitos representativos do mesmo conteúdo

A indexação é uma operação do tratamento técnico documental que se rege por princípios, que são independentes dos objectos aos quais se aplicam (os documentos), bem como dos meios téc- nicos e humanos e dos equipamentos que são utilizados. Esta afirmação tanto é válida para docu-

mentos próprios de Bibliotecas, como para documentos de Arquivo, desde que o objecto da indexação seja a espécie documental, independente do contexto em que se insere.

Porém, quando não se trata de indexar documentos individuais, mas sim conjuntos documentais, compostos por um número elevado de espécies e contendo uma grande variedade de assuntos — como no caso das séries arquivísticas — há que definir métodos apropriados para disciplinar a análise do seu conteúdo, a identificação e a selecção dos conceitos a indexar. O processo de indexação manter­se­á na sua essência, embora a análise do conteúdo documental tenha de seguir orientações diferentes daquelas a que normalmente estamos habituados e que se encontram consagradas, por exemplo, na já referida NP­3715.

Diversamente do que aquela norma preconiza como método para análise do conteúdo dos docu­ mentos escritos12, não podemos considerar que a "apreensão global" de uma série arquivística impli­

que a "leitura minuciosa dos textos". Esta prática seria, evidentemente, impossível de realizar. No entanto, à semelhança do que preconiza a norma, consideramos que é possível estabelecer orienta­ ções para proceder à análise do conteúdo das séries e definir as "partes importantes" que "devem ser analisadas com cuidado"". Assim, deverão ser tidos em conta, essencialmente, os seguintes elementos:

— Título da série — quando exista; nestas circunstâncias ele pode ser retirado das lombadas ou capas dos livros, de folhas iniciais ou do interior dos mesmos.

— Termo de abertura — quando a série é formada por livros, na maioria dos casos, eles têm um termo de abertura, no qual é indicada a função a que se destinam.

— índices — em muitos casos, os livros ou os maços que constituem uma série contêm, no iní­ cio ou no final, índices ou listas de conteúdo, que são de extrema utilidade para o indexador.

— Tipos documentais — deverá analisar­se o conjunto da série, a fim de se verificar se há uni­ dade tipológica nos documentos que a compõem, ou se se trata de uma série "miscelânea", cons­ tituída por tipos documentais diversos. Esta análise é fundamental, pois a unidade tipológica faci­ lita a indexação, uma vez que, nos vários documentos, a organização do texto e o tipo de infor­ mação que registam são semelhantes.

— Elementos que c o m p õ e m cada documento ou cada assento1 — sendo as séries, geral­ mente, formadas por tipos documentais análogos, é possível, na maioria dos casos, determinar

12 Consideramos apenas os problemas relativos aos documentos escritos, pois foi este tipo de material que utilizámos como base de trabalho. Naturalmente que os documentos não escritos, ao serem tratados ao nível de série, também levantam pro­ blemas de indexação diversos dos que se põem no tratamento dos documentos individuais.

'■' Richard Smiraglia, no artigo já referido, "Subject Access to Archival Materials Using LCSH" define fases e métodos para a análise de conteúdo (subject analysis), embora as suas considerações se afastem muito do conceito de indexação, tal qual ele é consensualmente aceite, pois não limita a noção de "assunto" (subject) apenas ao conteúdo ideológico. Ao estabelecer categorias como "proveniência", "forma intelectual", "forma física", "forma de apresentação", determinando que elas devem ser tidas em conta no momento da análise dos materiais de arquivo, de modo algum está a restringir a indexação ao seu ver­ dadeiro objecto: o assunto. É, pois, um método que poderá ser válido para análise de conteúdo — entendido como aquilo que está contido — e indexação num sentido muito lato. Como esta "elasticidade" não é definida pressupòe­se que o autor se refere à indexação por assuntos, como é normalmente entendida. Sendo assim, o método proposto não será aplicável para a análise de conteúdo, pois as categorias estabelecidas não têm a ver com os assuntos.

" Das séries resultantes de actividades de controlo administrativo, como são os registos de variadíssimos tipos, os livros de

contas (assentos de receitas e despesas), os livros de cobranças, etc., etc., não se pode dizer que sejam compostas por docu­ mentos, mas sim por assentos que se sucedem, geralmente por ordem cronológica. A série é, pois. o resultado de uma activi­ dade ou função concretas de um organismo.

os elementos que integram o seu conteúdo e, a partir daí, identificar os assuntos a indexar. Quando os documentos obedecem a um "formulário" estereotipado (por exemplo, certos tipos de registos, as guias de receita, as ordens de pagamento, os livros de contabilidade, os termos, os contratos, as listas, etc.) ou contêm sempre o mesmo tipo de informações, com uma temática restrita, é mais fácil a identificação dos conceitos. Porém, há casos de séries que, mesmo apre- sentando unidade tipológica e sendo possível determinar os elementos que compõem o texto dos documentos, pela quantidade e diversidade dos assuntos que registam torna-se impraticável uma análise do seu conteúdo. Tais séries, no caso do A.H.M.P., reflectem a actividade genera- lizada da Câmara do Porto e provêm, essencialmente, dos serviços administrativos centrais. São. como atrás referimos, as séries "Vereações", "Próprias" (correspondência recebida), "Copiador Geral" e "Registo Geral". A imensidão de assuntos que comportam não permite uma análise de conteúdo, pois isso implicaria a leitura dos documentos e conduziria a um rol infindável de termos de indexação.

Todas as partes acima enunciadas deverão ser cuidadosamente analisadas e anotados os seus elementos, aquando da análise de uma série arquivística. Quanto mais detalhada for essa análise, maior possibilidade haverá de uma indexação correcta e exaustiva.

Relativamente à identificação dos conceitos, também existem implicações decorrentes do tipo de documentos a analisar. A NP-3715 enuncia princípios que, mais uma vez, não podem ser aplicados linearmente à indexação das séries arquivísticas. Esta norma refere que "os organismos devem construir grelhas de identificação que contenham os critérios considerados importantes na área abrangida pela indexação"1" e apresenta exemplos de critérios a fixar por tais grelhas.

Este método não pode ser utilizado na maioria dos Arquivos — no nosso caso, não tem mesmo qualquer aplicabilidade — pois é praticamente impossível definir quais as áreas abrangidas pela indexação, uma vez que a temática das séries é extraordinariamente diversificada e os interesses dos utilizadores são também muito variáveis, em função do perfil de cada um e das próprias ten- dências da investigação histórica. Além disso, os exemplos de critérios apontados na norma são, de todo, desajustados da realidade arquivística.

Assim sendo, há que definir critérios para proceder à identificação dos conceitos, não em fun- ção do domínio abrangido pelos documentos, mas do tipo de informação que eles contêm. A identificação dos conceitos passa, sobretudo, pela determinação da função de uma série arqui- vística e dos elementos informativos que a integram. Apesar disto, não podemos deixar de con- siderar a possibilidade de se estabelecerem algumas grelhas para identificação dos conceitos, as quais terão, essencialmente, a função de garantir a uniformidade possível no tratamento de temáticas análogas. Obviamente que tais grelhas terão de ser estabelecidas pelo indexador, com base nos temas mais frequentes e de acordo com as necessidades dos utilizadores"'. O factor "subjectividade" está inevitavelmente ligado ao processo de indexação, embora a aplicação de

" O. c , ponto 6.1, p. 5.

" A título de exemplo, sugerimos alguns critérios que podem servir para estabelecer as referidas grelhas, sobretudo no caso de um arquivo municipal, onde muitas das questões dos utilizadores se ligam a aspectos da vida local:

— a série refere profissões?

— a série refere zonas geográficas ou topónimos?

— no caso de se tratar de uma série relativa a comércio ou indústria, são indicados os produtos ou as mercadorias? — são mencionados edifícios, monumentos ou outro tipo de construções, como pontes, fontes, chafarizes, etc.? — existem referências a instituições?

— são referidas personalidades ligadas à arte, à cultura, à ciência? — etc.

métodos tendentes a estabelecer procedimentos coerentes seja fundamental, no sentido de uma análise mais objectiva.

Vamos considerar duas séries, para exemplificar o método de identificação dos conceitos repre- sentativos do seu conteúdo:

f — Licenças para Vendedores Ambulantes

Nesta série, destinada ao registo de certo tipo de licenças, o assunto principal será "licenças para venda ambulante" e os conceitos a identificar são "licenças" e "venda ambulante". Além disso, a análise de cada assento, no interior dos livros, permite a identificação de diversos elementos informativos, a saber: nome do vendedor; produtos a comercializar; área geográfica onde é exer- cida a venda; número, data e prazo da licença1". Face a tais elementos, é possível identificar

outros conceitos, embora com um grau de generalidade elevado. Teremos, então, "comerciantes", "produtos" (poderão ser identificados todos, se o seu número e diversidade não forem muito elevados, ou apenas o conceito genérico "produtos de comércio"), "locais" (se forem poucos também poderão ser todos identificados ou, então, apenas uma área geográfica mais abrangente, como uma zona urbana).

No caso dos comerciantes e dos locais de venda, que normalmente são muitos, o conceito a identificar será genérico, tal como impõe o nível de tratamento da série. A identificação de todos os nomes e de todos os topónimos seria um tratamento desadequado para fins de inventário, mas próprio de um catálogo.

2 — Recebimento da Décima. Cedofeita

Esta série destina-se a registar a receita proveniente da cobrança do imposto da décima sobre propri- edades, maneio (trabalho) e dinheiro emprestado a juros, dos moradores da freguesia de Cedofeita. A partir da análise da função da série, podem identificar-se os conceitos "décima", "receita" e "freguesia de Cedofeita". Com base nos elementos informativos de cada assento, verifica-se que também é possível identificar conceitos como "propriedade imobiliária", "maneio", "dinheiro a juros", "moradores". É óbvio que cada assento apresenta os conceitos de uma forma específica, indicando os nomes dos moradores e as quantias cobradas, por exemplo. Porém, a este nível, o indexador deverá identificar os conceitos, com exaustividade, mas não com a especificidade que a documentação apresenta, pois não se trata de produzir, por exemplo, um índice onomástico da série.

Relativamente à selecção dos conceitos, a NP-3715 determina que "o critério principal (...) deve ser sempre o seu valor potencial, como um elemento na expressão do conteúdo de um docu- mento e na sua recuperação. Ao escolher os conceitos, o indexador deve ter presentes as pergun- tas que podem ser feitas ao sistema de informação, tanto quanto possam ser conhecidas"18. Verifi-

camos, novamente, que a citada norma está concebida em função da espécie individual e não de conjuntos documentais, se bem que o critério apontado seja válido para a selecção dos conceitos no caso das séries arquivísticas. A sua aplicabilidade pressupõe, todavia, um conhecimento fun- damentado dos utilizadores. Se é certo que, num Arquivo, os utilizadores que o frequentam regu- larmente são, regra geral, em número reduzido — o que facilita a definição dos seus perfis —

17 A identificação de todos estes elementos é importante sobretudo para a elaboração do resumo de conteúdo, que faz parte da descrição arquivística e é produto da análise da série. Será, no entanto, a partir desse resumo que se isolarão os conceitos susceptíveis de serem representados por "termos de indexação" e de constituírem pontos de acesso para a pesquisa. 1K O. c , ponto 6.3.3-, p. 6.

também não é menos verdadeiro que carecemos, em absoluto, de estudos sobre as suas necessi- dades e os seus interesses.

No caso das séries que resultam de funções de controlo administrativo, cujos assentos obedecem a um "formulário" estereotipado, não é difícil a identificação dos conceitos. A selecção dos mesmos deve pautar-se por um máximo de exaustividade e um nível elevado de generalidade, tal como apontámos nos exemplos atrás escolhidos. Reter para indexação todos os conceitos identificados permite dar ao utilizador uma noção exacta do conteúdo duma série e, simulta- neamente, informar sobre as diferentes perspectivas de pesquisa a que a mesma pode servir. Ao nível de inventário, a indexação possibilita ao utilizador, acima de tudo, a escolha dos conjuntos documentais que terá de utilizar como fontes para um dado tipo de investigação. Tal como o próprio inventário, ela não tem como objectivo primeiro a localização de documentos indivi- duais, sobre assuntos particulares.

Quando se trata de séries constituídas por documentos com uma variedade temática incontrolável, já atrás referimos que não é possível a análise do seu conteúdo e, naturalmente, a identificação dos conceitos. Mesmo que se procurasse apenas identificar alguns conceitos (o que pressupõe, desde logo, uma selecção), não seria possível estabelecer critérios para orientar tal selecção, dado que todos eles seriam de ordem subjectiva1''. A solução que adoptámos, nestes casos, foi a de não

indexar esse tipo de séries.

Apesar destes condicionalismos, é de assinalar que tais séries, embora de uma riqueza informativa inestimável, são uma minoria no conjunto do Arquivo, representando, por isso, excepções no que respeita às possibilidades de indexação.