• Nenhum resultado encontrado

3 Classificação de objectos de aprendizagem

3.2 Classificação com sistemas existentes

3.2.1 Os sistemas de classificação tradicionais

A classificação é uma resposta natural à necessidade de organizar grandes quantidades de material, que facilita a sua localização de acordo com critérios preestabelecidos. De uma forma geral, a classificação pode ser definida como a organização de algo numa qualquer ordem sistemática. O acto de classificar envolve um processo metódico de decisão com base numa propriedade ou característica de interesse, distinguindo os objectos que possuem essa propriedade dos que não a têm, agrupando-os numa classe [Chan, 1994]. Segundo os especialistas [Chan, 2004], a classificação de documentos nasceu no Séc. XIX nos Estados Unidos da América, na sequência da destruição da maior parte das colecções da biblioteca do congresso, quando soldados britânicos incendiaram o Capitólio. Perante esta catástrofe, o antigo Presidente Thomas Jefferson disponibilizou a sua colecção privada de perto de seis mil livros como substituição, organizados segundo um sistema de classificação do próprio. A biblioteca acabou por adoptar este sistema de classificação, que foi usado até finais do Séc. XIX , apenas com ligeiras alterações.

Por volta de 1890 o número de livros cresceu de cerca de sete mil para quase um milhão, altura em que o sistema de Thomas Jefferson se mostrou incapaz de lidar com tal quantidade de documentos. Esta constatação, juntamente com a perspectiva de mudança de instalações, promoveu, no início do Séc. XX, o desenvolvimento de um novo sistema, que

foi chamado LCC - Library of Congress Classification. O sistema foi construído em torno de categorias, cada uma com subclasses ou grupos de subclasses, desenvolvidas e geridas por especialistas em cada assunto. Basicamente o sistema classifica cada documento e atribui-lhe uma única posição na estrutura, a que corresponderá uma determinada localização na biblioteca.

As estruturas das categorias foram sendo publicadas à medida que eram completadas, mas todas elas estão num estado contínuo de revisão. Actualmente, o sistema LCC, com as suas 21 categorias, como pode ser observado na Tabela 10, funciona como um sistema genérico de classificação de documentos, especialmente útil para as bibliotecas tradicionais. As categorias principais são identificadas por uma letra e cada uma delas expande-se em subclasses, identificadas por outra letra. Cada subclasse pode por sua vez ser dividida em vários temas, mas a codificação dos temas passa a usar números em vez de letras. A Tabela 11 mostra os temas da subclasse “Química” da categoria Q – Ciência.

A- Trabalhos gerais B- Filosofia

C- Ciências auxiliares da história D– História (geral)

E,F– História (Américas) G– Geografia H– Ciências sociais J– Ciência política K– Lei L- Educação M– Música N– Artes visuais P– Linguagem e literatura Q– Ciência R– Medicina S– Agricultura T– Tecnologia U– Ciência militar V– Ciência naval

Z- Bibliografia; Ciência bibliográfica Tabela 10 – As categorias principais do sistema LCC

A cada documento é então atribuído um único código, designado código de chamada, com letras e números que representam respectivamente a classe, as subclasses e o tema onde o documento se insere. Adicionalmente poderão ser adicionadas outras informações sobre o documento, como por exemplo o autor e a data de publicação, acrescentando um ponto e códigos adicionais. Q– Ciência QA- Matemática QB- Astronomia QC- Física QD – Química 71-142 Química analítica 146-197 Química inorgânica 241-441 Química orgânica 415-436 Bioquímica

450-801 Química física e teórica 625-655 Química das radiações 701-731 Fotoquímica

901-999 Cristalografia QE- Geologia

QK- Botânica QL-Zoologia

QM- Anatomia humana QP- Fisiologia QR- Microbiologia

Tabela 11 – Exemplo de subclasses LCC

Um outro sistema de classificação muito conhecido é o DDC – Dewey Decimal

Classification [Dewey, 1876], desenvolvido na década de setenta do Séc. XIX por um

único indivíduo, Melvin Dewey. Este sistema usa códigos puramente numéricos para definir as categorias, subclasses e temas, com um máximo de dez classes em cada nível, sendo cada classe representada por um algarismo de 0 a 9. A profundidade mínima é de três níveis, o que significa que um código DDC possui no mínimo três algarismos. A partir do nível três de profundidade, é usado o separador decimal, seguindo-se os algarismos das subclasses dos níveis seguintes. A grande vantagem desta notação é que o sistema é infinitamente extensível, dado que não existe limite ao número de algarismos usados e a introdução de novas subclasses não perturba a notação do resto do sistema. A Tabela 12 mostra as dez categorias principais do sistema DDC.

* 000 Generalidades

* 100 Filosofia e psicologia * 200 Religião

* 300 Ciências sociais * 400 Linguagem

* 500 Ciências naturais e matemática * 600 Tecnologia (ciências aplicadas) * 700 Artes

* 800 Literatura

* 900 Geografia e história

Tabela 12 – As categorias principais do DDC

Tal como no sistema LCC, cada uma das categorias principais tem várias subclasses, que por sua vez estão subdivididas em temas mais específicos. A Tabela 13 ilustra parte da estrutura de classificação da categoria 500

* 500 Ciências naturais e matemática 510 Matemática

511 Princípios gerais

512 Álgebra e teoria dos números 513 Aritmética 514 Topologia 515 Análise 516 Geometria 517 Não usado 518 Não usado

519 Probabilidades e matemática aplicada 520 Astronomia

540 Química 550 Ciências da terra 560 Paleontologia 570 Ciências da vida 580 Botânica 590 Zoologia

Tabela 13 – Exemplo de subclasses DDC

Foi com base no sistema DDC que os Belgas Paul Otlet e Henri la Fontaine criaram no final do Séc. XIX o sistema UDC – Universal Decimal Classification [McIlwaine, 2000]. Este sistema, para além das propriedades do DDC, acrescenta sinais auxiliares para indicar aspectos complementares e relacionamentos entre temas, permitindo classificar documentos de forma multifacetada. A Tabela 14 mostra o significado de alguns desses auxiliares.

O sistema UDC é usado internacionalmente e conta actualmente com cerca de 220,000 temas diferentes. Enquanto que os sistemas LCC e DDC foram concebidos com o objectivo principal de organizar livros e outros documentos escritos em prateleiras de bibliotecas, de acordo com uma sequência lógica de temas, o sistema UDC acrescenta um propósito muito mais ambicioso: representar e organizar de forma estruturada todo o conhecimento.

Sinal Significado

+

Permite atribuir várias classificações possíveis, por exemplo 59 + 636 significa que o objecto está classificado como zoologia (59x)e alimentação animal (636)

/

Permite atribuir várias classificações contíguas, por exemplo 592 / 599 significa que o objecto está classificado em todas as subclasses desde a 592 até à 599

: Permite relacionar dois temas, por exemplo 17 : 7 significa ética (17x) da arte (7xx)

[] Permite agrupar algebricamente vários temas, por exemplo 31 : [622 + 669] significa estatísticas (31x) de exploração mineira (622) e metalurgia (669) = Permite definir qual a linguagem, por exemplo 59 = 20 significa Zoologia

(59x), em Inglês (20)

Tabela 14 – Exemplos de auxiliares UDC

A associação Americana ACM – Association for Computing Machinery desenvolveu um sistema próprio de classificação, designado CSS [ACM CSS, 1998], usado há várias décadas para classificar publicações científicas na sua área de intervenção. O sistema baseia-se numa estrutura hierárquica em árvore, com três níveis, em que o primeiro nível possui onze categorias principais. A Tabela 15 ilustra parte da estrutura do sistema CSS. Existe ainda um quarto nível, não codificado, que permite a inclusão de descritores de temas de forma a subdividir as categorias de nível três à medida que surgem novas áreas ou novos desenvolvimentos naquele campo. Por exemplo, na estrutura da Tabela 15, na categoria D.3.1, existem os descritores “semântica” e “sintaxe”, que definem dois temas mais específicos da teoria das linguagens de programação, mas não representam novas

A. Literatura genérica B. Hardware

C. Organização de sistemas de computadores D. Software D.0 Geral D.1 Técnicas de programação D.2 Engenharia de software D.3 Linguagens de programação D.3.0 Geral

D.3.1 Definições formais e teoria Semântica; Sintaxe D.3.2 Classificações de linguagens D.3.3 Características e conceitos D.3.4 Processadores D.3.m Miscelânea D.4 Sistemas operativos D.m Miscelânea E. Dados F. Teoria da computação G. Matemática da computação H. Sistemas de informação I. Metodologias de computação J. Aplicações da computação

K. Outros temas relacionados com a computação Tabela 15 – Fragmento da estrutura do sistema CSS

Paralelamente aos sistemas de classificação, foram também desenvolvidos vocabulários controlados para cabeçalhos de assuntos, com o objectivo de normalizar os termos, nomes e títulos usados para descrever um determinado assunto, sendo o LCSH – Library of

Congress Subject Headings um dos mais conhecidos [Chan, 1995].